王懷民:開(kāi)源在不確定性的時(shí)代更有競(jìng)爭(zhēng)力-每日快訊

2023-05-29 13:58:36


【資料圖】

新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)5月26日至5月30日,2023中關(guān)村論壇舉行期間,中科院院士、CCF開(kāi)源發(fā)展委員會(huì)主任王懷民教授發(fā)表了關(guān)于“開(kāi)源創(chuàng)新啟示”的演講。

王懷民表示,過(guò)去5年在人工智能領(lǐng)域大模型發(fā)展非常迅速,人們?cè)诖竽P偷难芯恐杏羞^(guò)懷疑,也有過(guò)積極的探索。大模型的不確定性造就了開(kāi)源模式和閉源模式同時(shí)推進(jìn)的基本格局。當(dāng)ChatGPT2發(fā)布之后,OpenAI也開(kāi)始閉源。在這樣的背景下,有很多參與到開(kāi)源大模型研究領(lǐng)域中的參與者懷疑OpenAI的開(kāi)源主張,也由此產(chǎn)生了一系列更多的所謂能夠替代ChatGPT的開(kāi)源的發(fā)展。去年年底ChatGPT發(fā)布之后,它所形成的潛力從學(xué)術(shù)界蔓延到全社會(huì)之后形成的影響力,一方面試圖在支撐著閉源的模式,同時(shí)也在激發(fā)著開(kāi)源模型的發(fā)展,那么究竟是開(kāi)源還是閉源,應(yīng)該如何發(fā)展?

在他看來(lái),閉源大模型的訓(xùn)練成本極高,最近發(fā)布的谷歌的大模型訓(xùn)練費(fèi)用超過(guò)了千億美元,因此說(shuō)閉源是保證商業(yè)投入的一個(gè)有效方式,也成為了閉源的理由。不過(guò),開(kāi)源創(chuàng)新已經(jīng)成為軟件發(fā)展乃至于IT技術(shù)發(fā)展的一種主流技術(shù)形態(tài),超級(jí)計(jì)算機(jī)的操作系統(tǒng)幾乎都是用Linux這樣的開(kāi)源軟件操作系統(tǒng)進(jìn)行構(gòu)建,智能手機(jī)的操作系統(tǒng)80%以上都由開(kāi)源的安卓系統(tǒng)支持,在云端,一些重要的軟件80%也是開(kāi)源支持的。在大模型出現(xiàn)之前,深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)框架也幾乎都是開(kāi)源的。

王懷民認(rèn)為,從整個(gè)市場(chǎng)形態(tài)看,國(guó)際IT產(chǎn)業(yè)從芯片到操作系統(tǒng)到數(shù)據(jù)庫(kù)到中間件,乃至于云邊端的軟件和設(shè)備發(fā)展模式,開(kāi)源模式是一種非常有競(jìng)爭(zhēng)力的形態(tài)。到了人工智能這個(gè)領(lǐng)域,最近ChatGPT是不開(kāi)源,但是META把它的LLaMA模型開(kāi)源,迅速地吸引了大量開(kāi)發(fā)者,和在互聯(lián)網(wǎng)時(shí)代Linux開(kāi)源狀態(tài)非常之相似。

“我們應(yīng)該思考,今天我們的這個(gè)時(shí)代是一個(gè)不確定性的時(shí)代還是因?yàn)榇竽P鸵呀?jīng)確定了的人工智能時(shí)代,這實(shí)際上是開(kāi)源和閉源能夠發(fā)揮有效作用的一個(gè)重要的態(tài)勢(shì)判斷。在這個(gè)過(guò)程中我們看到LLaMA模型,也看到整個(gè)人工智能大模型開(kāi)發(fā)過(guò)程中,開(kāi)源開(kāi)放是以不同的形態(tài)表征的,過(guò)去我們開(kāi)源軟件就是代碼要開(kāi)源,而今天在人工智能當(dāng)中數(shù)據(jù)的開(kāi)源,訓(xùn)練代碼的開(kāi)源,推理代碼的開(kāi)源,乃至于服務(wù)的開(kāi)放,是不同層面的開(kāi)放,都是被社會(huì)關(guān)注和接受的。比如說(shuō)ChatGPT雖然它的數(shù)據(jù)訓(xùn)練代碼、推理代碼都沒(méi)有開(kāi)放,但是把API和服務(wù)開(kāi)放之后,仍然可以吸引一大批在大模型驅(qū)動(dòng)下的新型人工智能開(kāi)發(fā)的探索?!蓖鯌衙裾f(shuō)。

開(kāi)源和閉源究竟哪一種模式更有效?王懷民表示,今天開(kāi)源已經(jīng)不簡(jiǎn)單是目的了,是一種推動(dòng)技術(shù)創(chuàng)新發(fā)展的手段,“在一個(gè)確定性的時(shí)代,微軟以它的企業(yè)組織模式封閉推進(jìn)一個(gè)產(chǎn)品的開(kāi)發(fā),我們稱為單性繁殖,每個(gè)新的產(chǎn)品都由微軟定義。但是在互聯(lián)網(wǎng)時(shí)代到來(lái)的時(shí)候,在一個(gè)不確定性的互聯(lián)網(wǎng)時(shí)代,開(kāi)源的競(jìng)爭(zhēng)力更強(qiáng),開(kāi)源Linux社區(qū)發(fā)布一個(gè)核心版本,更多人在這個(gè)核心版本上根據(jù)他對(duì)需求和領(lǐng)域的理解進(jìn)行不斷地修改,形成了雙性繁殖,能夠產(chǎn)生或者低成本產(chǎn)生更多的適應(yīng)未來(lái)發(fā)展的新版本,由環(huán)境來(lái)評(píng)價(jià),然后再迭代回來(lái)不斷地開(kāi)發(fā),這個(gè)新版本并不是由一家企業(yè)完成的,是由全社會(huì)參與的,開(kāi)源在不確定性的時(shí)代更加有競(jìng)爭(zhēng)力?!?/p>

(文章來(lái)源:新京報(bào))

標(biāo)簽:

關(guān)閉
新聞速遞