2023中關(guān)村論壇|基于大語言模型+向量數(shù)據(jù)庫的文獻知識庫Science Navigator V1.0發(fā)布

2023-05-30 17:03:00


(資料圖)

5月30日,在2023中關(guān)村論壇的人工智能驅(qū)動的科學研究論壇上,北京科學智能研究院、中國科學院計算機網(wǎng)絡(luò)信息中心、墨奇科技(北京)有限公司聯(lián)合發(fā)布了款基于大模型+向量檢索引擎的文獻知識庫Science Navigator V1.0。

根據(jù)美國國家科學基金會統(tǒng)計數(shù)據(jù),科研人員花費在查找和消化科技資料上的時間,需占全部科研時間的51%,計劃思考占8%,實驗研究占32%,書面總結(jié)占9%。科研檢索方式經(jīng)歷了眼查手翻的查閱式檢索、基于互聯(lián)網(wǎng)的搜索式檢索階段,將進入對話式檢索階段。

“但通過對話式大語言模型檢索是有局限性的,比如幻覺與偏見、數(shù)據(jù)滯后、緩存限制”,墨奇科技副總裁孟卓飛總結(jié),基于這些痛點,墨奇科技等提出大語言模型+向量數(shù)據(jù)庫=下一代文獻知識庫的概念,整個知識庫包括,以科研人員為代表的用戶層、以GPT4等為代表的模型層、由向量數(shù)據(jù)庫+搜索引擎組成的中間層、由文獻和教材等支撐的數(shù)據(jù)層。北京科學智能研究院、墨奇科技、中國科學院計算機網(wǎng)絡(luò)信息中心分別負責模型層、中間層、數(shù)據(jù)層。

據(jù)孟卓飛介紹,Science Navigator V1.0支持文本、圖片、表格、公式跨模態(tài)識別處理,科研人員可選用文心一言、LLM等各種大小模型,實現(xiàn)問題解析最佳效果,第一批已收錄化學、材料、AI等領(lǐng)域近百萬篇論文,未來將擴展至自然、人文學科億級文獻存儲。

(文章來源:北京商報)

標簽:

關(guān)閉
新聞速遞