91伊人久久大香线蕉_青久久久久国产线免观_亚洲无码久久精品视频_熟妇在线观看免费视频

大模型“已讀亂回”怎么辦?這個(gè)“加速器”給出解決方案

    更新時(shí)間:2024-07-08 16:13  

7月4日至7日,2024世界人工智能大會(huì)在上海拉開(kāi)帷幕。

現(xiàn)階段,“百模大戰(zhàn)”現(xiàn)象背后的中國(guó)大模型發(fā)展前景與堵點(diǎn)仍然是各界關(guān)注的焦點(diǎn)。如何幫助大模型信息的海洋中快速找準(zhǔn)航向,在數(shù)據(jù)的荒漠中找到高質(zhì)量的“水源”?以合合信息的大模型“加速器”解決方案為例,在大模型訓(xùn)練的上游階段,“加速器”中的文檔解析引擎將助力大模型突破在書(shū)籍、論文、研報(bào)等文檔中的版面解析障礙,從源頭為模型訓(xùn)練與應(yīng)用輸送純凈的“燃料”;“加速器”還加載了行業(yè)領(lǐng)先的acge文本向量化模型,助力大模型解決“已讀亂回”的“幻覺(jué)”問(wèn)題。

文檔解析技術(shù)是支撐大模型語(yǔ)料訓(xùn)練的關(guān)鍵技術(shù)之一,面臨著從海量文檔中高效提煉“智慧燃料”的艱巨任務(wù)。文檔解析引擎具備強(qiáng)大的“動(dòng)能”,最快1.5秒可解析百頁(yè)長(zhǎng)文檔中的文本、表格、圖像等非結(jié)構(gòu)化數(shù)據(jù),同時(shí),可智能還原文檔閱讀順序,加速了模型在預(yù)訓(xùn)練、開(kāi)發(fā)、使用落地等多方面的流程。

在現(xiàn)場(chǎng),參觀者紛紛前來(lái)體驗(yàn),通過(guò)選擇物理、醫(yī)學(xué)、金融、社會(huì)學(xué)等多個(gè)知識(shí)領(lǐng)域的文檔,向大模型提問(wèn)專(zhuān)業(yè)問(wèn)題,例如對(duì)特定表格內(nèi)容的總結(jié)、關(guān)鍵要素的分析等。對(duì)比測(cè)試結(jié)果顯示,加載了文檔解析引擎的大模型,在回答問(wèn)題的速度、準(zhǔn)確度上更勝一籌。

如果說(shuō)文檔解析是為大模型加滿(mǎn)油,acge模型則是為其配備了“導(dǎo)航系統(tǒng)”。據(jù)介紹,“加速器”加載了acge_text_embedding模型(簡(jiǎn)稱(chēng)“acge模型”),如同“指南針”一般,引導(dǎo)大模型在信息的汪洋大海中準(zhǔn)確定位目標(biāo),減少“幻覺(jué)”發(fā)生,提升回答問(wèn)題的準(zhǔn)確性和針對(duì)性。

acge模型通過(guò)對(duì)大量中文文本數(shù)據(jù)的深入學(xué)習(xí),提取文本特征,幫助大模型快速在信息的海洋里“撈針”,其在分類(lèi)和聚類(lèi)任務(wù)中展現(xiàn)出高準(zhǔn)確率。模型不僅在信息檢索和分類(lèi)任務(wù)上展現(xiàn)了性能,更通過(guò)持續(xù)學(xué)習(xí)機(jī)制,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的遺忘難題。

合合信息智能創(chuàng)新事業(yè)部總經(jīng)理唐琪提到,目前,大模型“加速器”已被多家大模型廠商應(yīng)用于金融、醫(yī)學(xué)、財(cái)經(jīng)、媒體等多領(lǐng)域的文檔的解析中,它不僅僅是一套技術(shù)工具,更是推動(dòng)行業(yè)專(zhuān)業(yè)知識(shí)管理革新、提升業(yè)務(wù)效率的重要基石。