中外院士共談大模型:安全問(wèn)題需設(shè)好“緊箍咒”

2023-09-07 19:23:12


(相關(guān)資料圖)

中新網(wǎng)上海9月7日電 (高志苗 王夢(mèng)瑤)“伏羲”說(shuō):9月1日上海不下雨。中國(guó)科學(xué)院院士、復(fù)旦大學(xué)副校長(zhǎng)張人禾7日在2023外灘大會(huì)上表示,20年來(lái)復(fù)旦大學(xué)首次舉辦戶外開(kāi)學(xué)典禮背后有氣象大模型的“預(yù)測(cè)助力”。

他介紹,“伏羲”是復(fù)旦基于學(xué)校自有云上科研智算平臺(tái)訓(xùn)練出的氣象大模型,擁有45億參數(shù),可以成功預(yù)報(bào)未來(lái)15天的全球天氣,每次預(yù)報(bào)耗時(shí)在3秒以內(nèi)?!啊恕A(yù)報(bào)的9月1日天氣與當(dāng)天結(jié)果完全一致,不僅為師生帶來(lái)難忘的青春回憶,也是高校創(chuàng)造全新科研范式的一大體現(xiàn)?!?/p>

從ChatGPT到文心一言、盤古、曹植……2022年年底OpenAI發(fā)布的ChatGPT掀起了全球大模型浪潮。以“科技·創(chuàng)造可持續(xù)未來(lái)”為主題的2023 INCLUSION·外灘大會(huì)7日開(kāi)幕。大模型成為大會(huì)關(guān)鍵詞的同時(shí),大模型安全等“冷思考”也成為專家關(guān)注的重點(diǎn)。

美國(guó)科學(xué)院院士、美國(guó)工程院院士、英國(guó)皇家學(xué)會(huì)外籍院士邁克爾·喬丹(Michael I.Jordan)表示,ChatGPT無(wú)法確定自己所寫內(nèi)容的正確性,因?yàn)樗夹g(shù)上是存在問(wèn)題的,而這個(gè)問(wèn)題它還沒(méi)有真正有效解決。在講到“不確定”時(shí),人非常擅長(zhǎng)處理溝通以及應(yīng)對(duì)不確定信息,ChatGPT沒(méi)有辦法對(duì)不確定性進(jìn)行量化,要找到可能的方法去應(yīng)對(duì)這些挑戰(zhàn)。

針對(duì)大模型的安全問(wèn)題,中國(guó)科學(xué)院院士何積豐認(rèn)為,主要體現(xiàn)在未經(jīng)同意的情況下,收集、使用和泄露個(gè)人信息。隱私問(wèn)題既可能發(fā)生在訓(xùn)練過(guò)程,也可能發(fā)生在使用過(guò)程中,大模型的生成能力則讓“隱私泄露”的方式變得多樣化,造成隱私保護(hù)更加困難。

“為了應(yīng)對(duì)這些問(wèn)題,我們需要大模型對(duì)齊技術(shù)?!焙畏e豐說(shuō),“對(duì)齊”是指系統(tǒng)的目標(biāo)和人類價(jià)值觀一致,使其符合設(shè)計(jì)者的利益和預(yù)期,不會(huì)產(chǎn)生意外的有害后果。“如果把人工智能看作西游記里的孫悟空,‘對(duì)齊’就是唐僧的緊箍咒。有了緊箍咒,就可以保證技術(shù)不會(huì)任意使用能力胡作非為?!?/p>

何積豐介紹,反饋強(qiáng)化學(xué)習(xí)是實(shí)現(xiàn)對(duì)齊的技術(shù)途徑,目前有兩種方式,一是通過(guò)人工反饋給模型不同的獎(jiǎng)勵(lì)信號(hào),引導(dǎo)模型的高質(zhì)量輸出;另一種方式是事先給大模型提供明確的原則,系統(tǒng)自動(dòng)訓(xùn)練模型對(duì)所有生成的輸出結(jié)果提供初始排序?!斑@意味著,不僅智能系統(tǒng)需要向人類價(jià)值觀對(duì)齊,人類的訓(xùn)練方法也要向價(jià)值觀對(duì)齊?!?/p>

邁克爾·喬丹強(qiáng)調(diào),人工智能不會(huì)替代人,它只是一個(gè)新的工程系統(tǒng)?!翱萍际且粋€(gè)很好的工程系統(tǒng),它應(yīng)該服務(wù)于每個(gè)人,應(yīng)該是公平、誠(chéng)實(shí)、透明、穩(wěn)定的,這些特性是整個(gè)工程系統(tǒng)的特點(diǎn),而不是系統(tǒng)當(dāng)中個(gè)體的特點(diǎn)。所以AI它是集體性的,是將我們團(tuán)結(jié)在一起的技術(shù)。”(完)

(原標(biāo)題:中外院士共談AI大模型:應(yīng)對(duì)大模型安全問(wèn)題需設(shè)好“緊箍咒”)

標(biāo)簽:

關(guān)閉
新聞速遞