自然語(yǔ)言處理“戰(zhàn)國(guó)時(shí)代”即將到來(lái)?

2023-03-16 08:10:01

北京時(shí)間3月15日凌晨,人工智能初創(chuàng)公司OpenAI公布新一代人工智能語(yǔ)言模型GPT-4。與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,而且在回答的細(xì)節(jié)和表述方面更有價(jià)值和人情味。


(資料圖)

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。”OpenAI在當(dāng)天的聲明中這樣表示。鑒于這是一個(gè)只訓(xùn)練了6個(gè)月且數(shù)據(jù)更新至2021年9月的模型,我們有理由推測(cè)出它的后續(xù)升級(jí)版本將可能做出更多令人驚艷的事情。有專家推測(cè),OpenAI正在小心翼翼控制節(jié)奏,以防人們被太過(guò)聰明的工具“嚇”到。

GPT-4 VS ChatGPT

與ChatGPT相比,GPT-4最大的改變就是增加了圖片輸入支持,并可輸出圖片或文本。這使它從一個(gè)單純的文本聊天工具變成一個(gè)多模態(tài)語(yǔ)言模型。

目前圖像處理功能尚未公開(kāi),不過(guò)OpenAI在官網(wǎng)上展示了一系列案例。上海人工智能研究院研究員王資凱注意到,其中有一個(gè)案例是讓GPT-4預(yù)測(cè)將圖片中的氫氣球繩子剪斷后會(huì)怎樣。“這是一個(gè)涉及圖片理解、常識(shí)和推理的問(wèn)題,沒(méi)見(jiàn)過(guò)氣球的人很難回答。”不過(guò),GPT-4很好地預(yù)測(cè)了氣球的走向。“或許GPT-4已經(jīng)能根據(jù)周?chē)鷪?chǎng)景,猜出一個(gè)密閉的盒子里裝的是什么。”王資凱說(shuō)。

在中國(guó)計(jì)算機(jī)學(xué)會(huì)術(shù)語(yǔ)工委副主任、同濟(jì)大學(xué)特聘研究員王昊奮看來(lái),更能體現(xiàn)GPT-4水準(zhǔn)的要數(shù)它對(duì)于非自然圖像的理解,如圖表、考試題目截圖、論文截圖等,這也解釋了它為何能在各種考試中拔得頭籌。在演示中,GPT-4幫助美國(guó)一對(duì)虛擬夫婦在特定納稅年度里完成了報(bào)稅,這意味著它能讀懂大量知識(shí)性文檔。

GPT-4可輸入25000個(gè)詞,約是ChatGPT的八倍,這使得它的邏輯推理能力更上一層樓。據(jù)介紹,它已在包括美國(guó)律師資格考試、法學(xué)院入學(xué)考試、“美國(guó)高考”數(shù)學(xué)部分和證據(jù)性閱讀與寫(xiě)作部分等考試中,得分高于88%的應(yīng)試者。

“角色扮演”讓GPT-4如有神助

“你是一位AI編程助手,第一步謹(jǐn)慎、逐字地遵循用戶需求;第二步一步一步思考,闡述你如何構(gòu)造代碼;第三步在一個(gè)單獨(dú)程序塊中生成代碼;第四步盡可能減少其他不嚴(yán)謹(jǐn)……”在官方發(fā)布的演示中,王昊奮注意到一個(gè)細(xì)節(jié),OpenAI總裁和聯(lián)合創(chuàng)始人格雷格·布羅克曼試圖讓GPT-4在回答復(fù)雜問(wèn)題前先扮演某種角色。

“我們把這種引導(dǎo)稱為‘元指令’,也就是給機(jī)器一個(gè)人設(shè),比如一名醫(yī)生、一名律師、一名編輯等,然后告訴它要做什么工作。”王昊奮說(shuō)。作為ChatGPT全球首批百萬(wàn)用戶之一,王昊奮掌握了不少使用心得,角色扮演的“元指令”是他經(jīng)過(guò)長(zhǎng)期使用后總結(jié)出的讓ChatGPT生成更好回答的方法之一。而在此次最新發(fā)布的GPT-4中,他發(fā)現(xiàn),OpenAI公司也注意到了這一現(xiàn)象,并有意引導(dǎo)機(jī)器去扮演某種角色。

讓機(jī)器擁有“人設(shè)”,是否意味著GPT-4已經(jīng)具備了智能?在王資凱看來(lái),答案是肯定的。就像人類制造飛機(jī)沒(méi)有用鳥(niǎo)的方式,而是通過(guò)空氣動(dòng)力學(xué)讓一套機(jī)械裝置飛起來(lái)了一樣,人工智能也用自己的方式擁有了智能。不過(guò),人類也無(wú)需恐慌,因?yàn)檫@仍然只是一個(gè)工具,而且通往智能的道路并非只有一條。

數(shù)十款多模態(tài)語(yǔ)言模型將同臺(tái)競(jìng)爭(zhēng)

就在GPT-4發(fā)布的幾天前,谷歌悄悄上線了一款炸彈級(jí)模型PaLM-E——足足有5620億參數(shù),它將真實(shí)世界的傳感器信號(hào)與文本輸入相結(jié)合,建立語(yǔ)言和感知的鏈接;根據(jù)計(jì)劃,百度將于今天發(fā)布類ChatGPT模型“文心一言”;而此前,由OpenAI前員工研發(fā)的ChatGPT競(jìng)品Claude已開(kāi)放API接口……正如ChatGPT上線后多位專家預(yù)測(cè)的那樣,自然語(yǔ)言處理的“戰(zhàn)國(guó)時(shí)代”即將到來(lái),未來(lái),全球估計(jì)將會(huì)有數(shù)十款多模態(tài)語(yǔ)言模型同臺(tái)競(jìng)技。

在王昊奮看來(lái),OpenAI并非風(fēng)光無(wú)限,而是感受到了切實(shí)的壓力,這導(dǎo)致了GPT-4匆忙上線。畢竟,“該模型最大的亮點(diǎn)圖文識(shí)別沒(méi)有放開(kāi)測(cè)試,并不符合OpenAI的一貫風(fēng)格”。

不過(guò),他也提醒人們注意,GPT-4的訓(xùn)練數(shù)據(jù)只更新到2021年,不排除后續(xù)會(huì)有更豐富的語(yǔ)料庫(kù)訓(xùn)練版本。這次,他們很快就將自家的圖像模型DALL-E整合進(jìn)GPT-4,不僅工程技術(shù)難度不容小覷,而且更考驗(yàn)?zāi)P腿诤蟽煞N類型數(shù)據(jù)的穩(wěn)定性和成本。專家預(yù)計(jì),OpenAI內(nèi)部還藏有“殺手锏”,將再一次帶給人們沖擊。

標(biāo)簽:

關(guān)閉
新聞速遞