【環(huán)球新視野】達(dá)摩院AI模型打破中文語言理解榜單紀(jì)錄 首次超越人類成績

2022-11-25 17:44:31


(資料圖)

11月25日消息,在最新的中文語言理解領(lǐng)域權(quán)威榜單CLUE中,來自阿里達(dá)摩院的AI模型“通義AliceMind”以86.685的總分成績創(chuàng)造了新紀(jì)錄,這是該榜單誕生近三年以來,AI首次超越人類成績(86.678),意味著AI模型的中文語言理解水平達(dá)到了新的高度。

作為業(yè)界最權(quán)威的中文自然語言理解榜單之一,CLUE從文本分類、閱讀理解、自然語言推理等9項(xiàng)任務(wù)中全面考核AI模型的語言理解能力。過去三年,該榜單吸引了眾多國內(nèi)頂尖NLP團(tuán)隊(duì)的參與,盡管榜首位置多次易主,但參評AI模型一直未能超越人類成績。

根據(jù)最新的結(jié)果,阿里通義AliceMind在4項(xiàng)任務(wù)中的表現(xiàn)超過人類水平,同時(shí)實(shí)現(xiàn)了總榜平均分的首次超越。

需要注意的是,中文語言理解是AI業(yè)界亟待攻克的難題之一。阿里方面表示,為提升AI模型對詞語、句子以及語言整體的理解力,在預(yù)訓(xùn)練階段,達(dá)摩院沿用超大規(guī)模模型訓(xùn)練所使用的海量高質(zhì)量中文文本,同時(shí)對模型結(jié)構(gòu)和訓(xùn)練技術(shù)進(jìn)行了一系列優(yōu)化,如使用激活函數(shù)GLU、字詞混合的大詞表等獲得更強(qiáng)的文本建模能力,使用StrongHold訓(xùn)練加速技術(shù)縮短迭代周期、節(jié)約算力成本,進(jìn)而獲得性能的顯著提升。在精調(diào)階段,面對文本分類、閱讀理解、自然語言推理等下游任務(wù),達(dá)摩院采用了遷移學(xué)習(xí)、數(shù)據(jù)增強(qiáng)、特征增強(qiáng)等技術(shù),進(jìn)一步提升模型表現(xiàn)。

在應(yīng)用方面,通義AliceMind模型體系涵蓋預(yù)訓(xùn)練模型、多語言預(yù)訓(xùn)練模型、超大中文預(yù)訓(xùn)練模型等,具備閱讀理解、機(jī)器翻譯、對話問答、文檔處理等多種能力。目前,相關(guān)技術(shù)已應(yīng)用于醫(yī)療、電商、法律等領(lǐng)域,在跨境電商領(lǐng)域,達(dá)摩院的機(jī)器翻譯系統(tǒng)能提供214種語言的互譯服務(wù)。其基礎(chǔ)模型已在ModelScope平臺(魔搭,https://modelscope.cn)開放。

(文章來源:新京報(bào))

標(biāo)簽:

關(guān)閉
新聞速遞