微軟崔宏禹:GPT-4以后,不建議再用微調(diào)進(jìn)行模型適配

2023-05-27 15:57:09

5月26日,微軟(中國)有限公司創(chuàng)新技術(shù)總經(jīng)理崔宏禹在上海舉行的向星力·未來數(shù)據(jù)技術(shù)峰會(huì)(FDTC)上回應(yīng)了當(dāng)下一個(gè)廣泛被提及的問題,即如何用自己的數(shù)據(jù)訓(xùn)練自己的模型,將私域數(shù)據(jù)與GPT的能力相融合。

崔宏禹解答道,“一般來說,我們推薦兩種方式。一種是微調(diào)(在不改動(dòng)預(yù)訓(xùn)練模型的基礎(chǔ)上,在模型頂層增加分類器或一些特征映射,使微調(diào)后的模型能夠更貼合實(shí)際使用場景),但在GPT-4以后,我們已經(jīng)不建議或者已經(jīng)不讓大家使用微調(diào)的方式了。我們更推薦的是嵌入(將一個(gè)內(nèi)容實(shí)體映射為低維向量,從而可以獲得內(nèi)容之間的相似度)的方式?!?/p>

在會(huì)上,崔宏禹談起微軟跟OpenAI合作背后的故事,以及合作以后微軟的變化和思考邏輯。


(資料圖片)

以下為澎湃科技(www.thepaper.cn)整理的演講實(shí)錄,有刪減:

我想講一講背后的一些故事,我們?yōu)槭裁催x擇和OpenAI合作,選擇跟OpenAI合作以后,微軟有一些什么樣的變化和思考。

大家知道微軟投了OpenAI,而且是和OpenAI獨(dú)家合作,為什么當(dāng)時(shí)有這樣的決策?是因?yàn)槲覀円呀?jīng)看到這個(gè)技術(shù)對未來的產(chǎn)品、服務(wù)起到的加速作用。當(dāng)然,這個(gè)決策過程是非常糾結(jié)的。

大家知道,微軟在2019年給了OpenAI第一筆投資,實(shí)際上在2018年,我們內(nèi)部就在做要不要投OpenAI的決策,那個(gè)時(shí)候CFO(艾米·胡德)是反對的,她覺得微軟有這么多做人工智能的團(tuán)隊(duì),為什么還要去投一個(gè)初創(chuàng)公司,微軟自己也有團(tuán)隊(duì)在做大模型,為什么還要投初創(chuàng)公司?當(dāng)時(shí)CEO(薩提亞·納德拉)沒有辦法說服CFO向OpenAI投資,他就利用他的老關(guān)系,把GPU交給OpenAI去做測試和訓(xùn)練。因?yàn)檫@個(gè)原因,所以才有了后面的合作。

在這個(gè)基礎(chǔ)之上,和OpenAI合作以后,要么“all in”,要么“走人”。為什么這么說?大家可以發(fā)現(xiàn),最近微軟的產(chǎn)品更新?lián)Q代特別快,這不是我們以前心目中對微軟產(chǎn)品發(fā)布的印象。比如GPT-4剛出來兩個(gè)禮拜,我們就宣布在大家最熟悉的微軟Office中加一個(gè)Copilot,背后由GPT-4模型支持。再加上前天的微軟技術(shù)大會(huì),我們正式宣布在下一個(gè)版本的Windows中也要加入Copilot,背后也是有GPT-4的加持。也就是說,我們所有的產(chǎn)品都會(huì)“all in”,如果不這樣做,就“走人”。

這給了我們一個(gè)啟示,在現(xiàn)階段,尤其是在目前人工智能的階段,要積極地?fù)肀录夹g(shù),要敢于去嘗試,只有當(dāng)你去嘗試的時(shí)候,才會(huì)發(fā)現(xiàn)中間的很多問題,才知道這個(gè)事情的關(guān)鍵在什么地方。

目前OpenAI全部的產(chǎn)品線和服務(wù)在微軟的公有云平臺(tái)上都有體現(xiàn),為什么要這樣做?OpenAI為什么自己不能提供這些服務(wù)?

背后的邏輯是這樣的,OpenAI和微軟的合作首先要解決商業(yè)化問題。因?yàn)镺penAI是一個(gè)初創(chuàng)公司,專注在其產(chǎn)品線的開發(fā)上,但在商業(yè)領(lǐng)域還有很多要解決的問題,比如數(shù)據(jù)的合規(guī)性、安全性、隱私性,服務(wù)水平、解決方案的全面程度等,而OpenAI作為初創(chuàng)公司,它的現(xiàn)金流可能不放在這里,跟微軟合作恰恰能解決這些問題。最近ChatGPT在意大利被禁止使用,就是因?yàn)榇嬖跀?shù)據(jù)隱私和安全的問題。OpanAI希望通過跟微軟的合作,利用微軟在安全合規(guī)、隱私解決方案方面的能力來幫它解決。

現(xiàn)在有一個(gè)問題,如何用自己的數(shù)據(jù)訓(xùn)練自己的模型,把私域的數(shù)據(jù)融合到GPT能力里?也就是說對特定領(lǐng)域的數(shù)據(jù)進(jìn)行模型適配。

一般來說,我們推薦兩種方式。一種是微調(diào)(fine-tune,在不改動(dòng)預(yù)訓(xùn)練模型的基礎(chǔ)上,在模型頂層增加分類器或一些特征映射,使微調(diào)后的模型能夠更貼合實(shí)際使用場景),但在GPT-4以后,我們已經(jīng)不建議或者已經(jīng)不讓大家使用微調(diào)的方式了。因?yàn)槲覀儾徽J(rèn)為外面的一個(gè)組織、一個(gè)公司通過微調(diào)方式訓(xùn)練出的模型,比這家公司自己訓(xùn)練出來的能力還要好。我們更推薦的是嵌入式(embedding,將一個(gè)內(nèi)容實(shí)體映射為低維向量,從而可以獲得內(nèi)容之間的相似度)的方式。嵌入式方式的原理很簡單,把企業(yè)內(nèi)的私有數(shù)據(jù)和文檔做向量化或矢量化(嵌入向量可以捕獲單詞、短語或文本的語義信息,使得它們可以在數(shù)學(xué)上進(jìn)行比較和計(jì)算),然后去做匹配(兩個(gè)向量之間的距離用于測量它們之間的相關(guān)性,較小距離表示高相關(guān)性,較大距離表示低相關(guān)性),相似度在0.3以下就認(rèn)為這個(gè)信息的檢索已經(jīng)非常準(zhǔn)確。

在大模型應(yīng)用中有一個(gè)叫嵌入式應(yīng)用,實(shí)際上就是Copilot,即駕駛輔助的角色。這個(gè)模型非常簡單,在底層基礎(chǔ)能力的加持下,在中間這層AI編排的機(jī)制下,再往上走,就可以提供一個(gè)Copilot服務(wù),再加上插件的應(yīng)用,就可以應(yīng)用在現(xiàn)有的系統(tǒng),只要有插件就可以方便地把數(shù)據(jù)接入進(jìn)來,相當(dāng)于在原有的系統(tǒng)之外構(gòu)建了一個(gè)輔助駕駛。

微軟的系統(tǒng)為什么發(fā)展得這么快?就是利用了這套架構(gòu)。當(dāng)然也有插件,我們覺得OpenAI的插件系統(tǒng)未來會(huì)改變商業(yè)模式和游戲規(guī)則。如果你們用過微軟最新的必應(yīng)搜索就可以發(fā)現(xiàn),在對話過程中它可以跟網(wǎng)站交互獲取大量實(shí)時(shí)數(shù)據(jù)。以后必應(yīng)會(huì)改變整個(gè)應(yīng)用的生態(tài)和游戲規(guī)則。

在此基礎(chǔ)之上,我們怎么看這個(gè)世界?

第一,GPT背后,一部分是技術(shù)的加持,另一部分是人才、資源、文化。這一點(diǎn)說明我們離不開企業(yè)非常優(yōu)秀的數(shù)據(jù),離不開這些技術(shù)模型。但同時(shí),我特別想強(qiáng)調(diào)一點(diǎn),如果我們這個(gè)公司的人沒有開放的心態(tài)去擁抱新技術(shù)、擁抱新產(chǎn)品,那這個(gè)事情可能也做不了。ChatGPT之所以成功,它是源自于這三方面的成果。這一點(diǎn),我想,對很多企業(yè)可能有一定思考價(jià)值。有了最新的技術(shù),有了非常良好的數(shù)據(jù),但如果企業(yè)沒有這樣的文化,可能也是有問題的。

第二,大模型要實(shí)現(xiàn)平民化。OpenAI就是想讓AI真正Open,讓邊際成本急劇降低。2012年以后,人工智能興起,深度學(xué)習(xí)興起,但那時(shí)候每一個(gè)SKU(最小存貨單位Stock Keeping Unit,比如銷量數(shù)據(jù)都是以SKU為單位收集,建立預(yù)測模型就要為每個(gè)SKU單獨(dú)訓(xùn)練一個(gè)模型)都要單獨(dú)去做訓(xùn)練,我們做了太多的項(xiàng)目都是這樣,成本很高。但是新的AIGC(人工智能生成內(nèi)容)的模型是通用化的模型,降低再訓(xùn)練的成本,實(shí)際上是把邊際成本急劇降低。只有當(dāng)大家都能用的時(shí)候,才能說這是人工智能時(shí)代,如果只有少數(shù)人在用,那不叫一個(gè)時(shí)代。

微軟也是這么做的,M365(Microsoft 365,基于Microsoft Office 辦公室套件的云端辦公室方案)就是用這個(gè)方法來實(shí)現(xiàn)的。在原來微軟的Office加了一個(gè)Copilot,左下角有一個(gè)Graph(存儲(chǔ)了電子郵件、文件會(huì)議、聊天和日歷筆記等office辦公軟件集合的所有內(nèi)容),相當(dāng)于M365下的知識(shí)庫,通過中間的Copilot能夠迅速構(gòu)建知識(shí)庫和文檔之間的合作關(guān)系。這樣可以實(shí)現(xiàn),在Windows文檔中輸入幾句話,比如簡要概述一下研究報(bào)告的核心思想,就可以把報(bào)告總結(jié)成5頁P(yáng)PT。等它正式上線以后,大家可以體會(huì)一下,會(huì)急劇提高生產(chǎn)力。

最根本來說,它就是把人不擅長的事情機(jī)器化了。我們知道人在面對自己解決不了的問題時(shí),一定要求助于工具,生活中是這樣,IT行業(yè)也是這樣,讓人類教會(huì)機(jī)器來做人類不擅長的事情。我想引用管理學(xué)大師德魯克先生(彼得·德魯克)的一句話,動(dòng)蕩時(shí)代的最大風(fēng)險(xiǎn)不是動(dòng)蕩本身,而是企圖以昨天的邏輯來應(yīng)對動(dòng)蕩。

標(biāo)簽:

關(guān)閉
新聞速遞