天天亮點!以基礎設施角度看待大模型 智源解讀行業(yè)生態(tài)與開源路徑思考

2023-06-10 19:02:16


(資料圖片僅供參考)

6月9日至10日,第五屆北京智源大會在京舉行,現場,智源研究院院長黃鐵軍發(fā)布了全面開源的“悟道3.0”大模型系列,并帶來一系列產品:“悟道·天鷹(Aquila)”語言大模型系列、“天秤(FlagEval)”大語言評測體系及開放平臺,“悟道 · 視界”視覺大模型系列,以及一系列多模態(tài)模型成果。

采訪中,黃鐵軍表示,目前制約國內大模型行業(yè)發(fā)展的一點就是“太熱”,業(yè)界應避免重復性發(fā)力,集中力量辦大事。

公開資料顯示,智源研究院是國內最早進行大模型研究的科研機構之一,自2020年10月啟動大模型研發(fā)工作。所謂“大模型”,目前業(yè)界有不同定義,黃鐵軍認為需具備三個條件:一是規(guī)模要大,參數達百億規(guī)模以上;二是涌現性,能夠產生預料之外的新能力;三是通用性,不限于專門問題或領域,能夠處理多種不同的任務。

《中國人工智能大模型地圖研究報告》顯示,截至今年5月28日,中國10億參數規(guī)模以上的大模型已發(fā)布79個。在黃鐵軍看來,目前行業(yè)低水平重復與碎片化現象比較嚴重,這種現象會造成資源分散,很難形成重大影響的系統(tǒng)性突破。且黃鐵軍并不認為未來會有幾十個,甚至十幾個大模型存在下去。大模型只是全球大模型生態(tài)中的一個環(huán)節(jié),未來全球可能只有極少數的兩三個大模型生態(tài)。

“大模型最終比的是智能水平,”黃鐵軍表示,多個大模型存在的地方,肯定是智力水平最高的大模型生態(tài)會被絕大多數人使用,贏者通吃的現象從來都是起作用的,最重要的是,應從基礎設施的角度來看待大模型,將來智力可以作為通用的社會流通要素,人人都可以得到它,其價格也將類似于水電低成本的方式讓全社會使用,這是放大人工智能能力的最佳方式。

“極少數大模型生態(tài)起基礎性作用,基于智力的基礎設施提供各種應用與服務,這是一個正常的生態(tài)?!秉S鐵軍表示。為了搭建服務千行百業(yè)的大模型生態(tài),智源選擇將大模型開源。

此次智源發(fā)布新進展的FlagOpen 大模型技術開源體系,旨在打造全面支撐大模型技術發(fā)展的開源算法體系和一站式基礎軟件平臺。黃鐵軍表示,大模型不是任何一家機構或公司可以壟斷的技術,而是大家共建共享,行業(yè)需共建一個智力社會需要的基礎算法體系。在黃鐵軍看來,Linux和安卓生態(tài)差別很大,后者是Google掌控下的開源社區(qū),需要符合主導者的意志。“我們作為非營利機構,期望將來人工智能開源開放的方向是Linux這樣的開源開放?!秉S鐵軍稱。

另外針對智源開源生態(tài)與國內生態(tài)之間的區(qū)別,智源研究院副院長、總工程師林詠華對第一財經記者表示,大模型具備兩層生態(tài)的特殊之處——過去所謂的應用生態(tài)是第二層生態(tài),與基礎大模型更緊密的生態(tài)是基于基礎模型進行持續(xù)訓練而產生的領域基礎模型,或基于基礎模型去訓練自身應用,經微調之后的領域應用模型。林詠華表示,智源更適合基于自身開源的基礎模型去發(fā)展后一類大模型生態(tài)。

至于該類大模型生態(tài)與國內包括阿里、騰訊、華為、百度等互聯網大廠之間的區(qū)別,林詠華稱,有實力的互聯網公司如BAT、華為等,會傾向于用自己研發(fā)的大模型。由于其商業(yè)原因,大多數不會開源。但更廣泛的行業(yè)企業(yè),需要在優(yōu)質的開源基礎模型之上再去開發(fā)其行業(yè)領域適用的模型。

(文章來源:第一財經)

標簽:

關閉
新聞速遞