畢業(yè)季臨近,全國高校畢業(yè)生陸續(xù)進入了忙碌的“答辯季”。進入“百米沖刺”階段,論文至關(guān)重要。對于理科工學(xué)生而言,論文中的數(shù)理化公式,稍不注意就容易輸錯,手動輸入誤差難以避免。近日,掃描全能王上線“公式識別”功能,基于AI掃描技術(shù),可以識別、提取復(fù)雜公式,并將LaTeX格式的公式文本渲染成為公式,實現(xiàn)公式用Word導(dǎo)出,支持用戶直接修改編輯公式,提高輸入效率。
“公式識別”看似簡單便捷,實現(xiàn)起來卻需要AI強大的“判斷力”做支撐。從最基礎(chǔ)的識別定義上來看,需要AI精準(zhǔn)區(qū)分哪些是真正需要識別的目標(biāo)。“1+1簡單算式與f(x)函數(shù)表達,是否皆為公式范疇?從識別的精準(zhǔn)率來看,AI如何將識別出的LaTeX文本轉(zhuǎn)化為直觀易讀的公式圖像?”據(jù)技術(shù)團隊成員介紹,通過AI算法的不斷精煉以及在文檔處理領(lǐng)域的技術(shù)積累,“公式識別”功能能夠精準(zhǔn)界定公式的判定規(guī)則,哪怕是復(fù)雜多變的數(shù)學(xué)表達式,亦能準(zhǔn)確捕獲。同時,基于對公式的深度理解,持續(xù)優(yōu)化識別模型,即使是“微妙”的數(shù)學(xué)符號,也能做到快速且精確識別。
相關(guān)功能預(yù)計在公式整理、論文撰寫等多個場景發(fā)揮作用。比如,初中學(xué)生想要整理公式,可以輕松將一張試卷中零散分布的公式匯總整理,變成自己的公式收集庫。大學(xué)生、教授想要撰寫論文,查看文獻時如有想要引用的公式,無需再自己手動對照公式進行手打,通過掃描拍攝,即可在Word文檔中直接打開為Mathml格式(公式格式),輕松引用。
在企業(yè)端,“公式識別”技術(shù)的應(yīng)用前景同樣廣闊。當(dāng)前,PDF等文檔格式的解析難題一直制約著信息的有效流轉(zhuǎn)與利用,尤其是在處理含有大量數(shù)學(xué)公式的科技文獻時,信息損失尤為嚴重。“公式識別”功能憑借優(yōu)秀的公式識別準(zhǔn)確率與強大的格式兼容性,有望成為智能解析文檔的關(guān)鍵助手,讓模型在處理專業(yè)領(lǐng)域問題時更為得心應(yīng)手。