日本最大色倩网站,国内精品自在自线在免费

微軟崔宏禹：GPT-4以后，不建議再用微調(diào)進(jìn)行模型適配

2023-05-27 15:57:09

5月26日，微軟（中國）有限公司創(chuàng)新技術(shù)總經(jīng)理崔宏禹在上海舉行的向星力·未來數(shù)據(jù)技術(shù)峰會(huì)（FDTC）上回應(yīng)了當(dāng)下一個(gè)廣泛被提及的問題，即如何用自己的數(shù)據(jù)訓(xùn)練自己的模型，將私域數(shù)據(jù)與GPT的能力相融合。

崔宏禹解答道，“一般來說，我們推薦兩種方式。一種是微調(diào)（在不改動(dòng)預(yù)訓(xùn)練模型的基礎(chǔ)上，在模型頂層增加分類器或一些特征映射，使微調(diào)后的模型能夠更貼合實(shí)際使用場景），但在GPT-4以后，我們已經(jīng)不建議或者已經(jīng)不讓大家使用微調(diào)的方式了。我們更推薦的是嵌入（將一個(gè)內(nèi)容實(shí)體映射為低維向量，從而可以獲得內(nèi)容之間的相似度）的方式?！?/p>

在會(huì)上，崔宏禹談起微軟跟OpenAI合作背后的故事，以及合作以后微軟的變化和思考邏輯。

(資料圖片)

以下為澎湃科技（www.thepaper.cn）整理的演講實(shí)錄，有刪減：

我想講一講背后的一些故事，我們?yōu)槭裁催x擇和OpenAI合作，選擇跟OpenAI合作以后，微軟有一些什么樣的變化和思考。

大家知道微軟投了OpenAI，而且是和OpenAI獨(dú)家合作，為什么當(dāng)時(shí)有這樣的決策？是因?yàn)槲覀円呀?jīng)看到這個(gè)技術(shù)對未來的產(chǎn)品、服務(wù)起到的加速作用。當(dāng)然，這個(gè)決策過程是非常糾結(jié)的。

大家知道，微軟在2019年給了OpenAI第一筆投資，實(shí)際上在2018年，我們內(nèi)部就在做要不要投OpenAI的決策，那個(gè)時(shí)候CFO（艾米·胡德）是反對的，她覺得微軟有這么多做人工智能的團(tuán)隊(duì)，為什么還要去投一個(gè)初創(chuàng)公司，微軟自己也有團(tuán)隊(duì)在做大模型，為什么還要投初創(chuàng)公司？當(dāng)時(shí)CEO（薩提亞·納德拉）沒有辦法說服CFO向OpenAI投資，他就利用他的老關(guān)系，把GPU交給OpenAI去做測試和訓(xùn)練。因?yàn)檫@個(gè)原因，所以才有了后面的合作。

在這個(gè)基礎(chǔ)之上，和OpenAI合作以后，要么“all in”，要么“走人”。為什么這么說？大家可以發(fā)現(xiàn)，最近微軟的產(chǎn)品更新?lián)Q代特別快，這不是我們以前心目中對微軟產(chǎn)品發(fā)布的印象。比如GPT-4剛出來兩個(gè)禮拜，我們就宣布在大家最熟悉的微軟Office中加一個(gè)Copilot，背后由GPT-4模型支持。再加上前天的微軟技術(shù)大會(huì)，我們正式宣布在下一個(gè)版本的Windows中也要加入Copilot，背后也是有GPT-4的加持。也就是說，我們所有的產(chǎn)品都會(huì)“all in”，如果不這樣做，就“走人”。

這給了我們一個(gè)啟示，在現(xiàn)階段，尤其是在目前人工智能的階段，要積極地?fù)肀录夹g(shù)，要敢于去嘗試，只有當(dāng)你去嘗試的時(shí)候，才會(huì)發(fā)現(xiàn)中間的很多問題，才知道這個(gè)事情的關(guān)鍵在什么地方。

目前OpenAI全部的產(chǎn)品線和服務(wù)在微軟的公有云平臺(tái)上都有體現(xiàn)，為什么要這樣做？OpenAI為什么自己不能提供這些服務(wù)？

背后的邏輯是這樣的，OpenAI和微軟的合作首先要解決商業(yè)化問題。因?yàn)镺penAI是一個(gè)初創(chuàng)公司，專注在其產(chǎn)品線的開發(fā)上，但在商業(yè)領(lǐng)域還有很多要解決的問題，比如數(shù)據(jù)的合規(guī)性、安全性、隱私性，服務(wù)水平、解決方案的全面程度等，而OpenAI作為初創(chuàng)公司，它的現(xiàn)金流可能不放在這里，跟微軟合作恰恰能解決這些問題。最近ChatGPT在意大利被禁止使用，就是因?yàn)榇嬖跀?shù)據(jù)隱私和安全的問題。OpanAI希望通過跟微軟的合作，利用微軟在安全合規(guī)、隱私解決方案方面的能力來幫它解決。

現(xiàn)在有一個(gè)問題，如何用自己的數(shù)據(jù)訓(xùn)練自己的模型，把私域的數(shù)據(jù)融合到GPT能力里？也就是說對特定領(lǐng)域的數(shù)據(jù)進(jìn)行模型適配。

一般來說，我們推薦兩種方式。一種是微調(diào)（fine-tune，在不改動(dòng)預(yù)訓(xùn)練模型的基礎(chǔ)上，在模型頂層增加分類器或一些特征映射，使微調(diào)后的模型能夠更貼合實(shí)際使用場景），但在GPT-4以后，我們已經(jīng)不建議或者已經(jīng)不讓大家使用微調(diào)的方式了。因?yàn)槲覀儾徽J(rèn)為外面的一個(gè)組織、一個(gè)公司通過微調(diào)方式訓(xùn)練出的模型，比這家公司自己訓(xùn)練出來的能力還要好。我們更推薦的是嵌入式（embedding，將一個(gè)內(nèi)容實(shí)體映射為低維向量，從而可以獲得內(nèi)容之間的相似度）的方式。嵌入式方式的原理很簡單，把企業(yè)內(nèi)的私有數(shù)據(jù)和文檔做向量化或矢量化（嵌入向量可以捕獲單詞、短語或文本的語義信息，使得它們可以在數(shù)學(xué)上進(jìn)行比較和計(jì)算），然后去做匹配（兩個(gè)向量之間的距離用于測量它們之間的相關(guān)性，較小距離表示高相關(guān)性，較大距離表示低相關(guān)性），相似度在0.3以下就認(rèn)為這個(gè)信息的檢索已經(jīng)非常準(zhǔn)確。

在大模型應(yīng)用中有一個(gè)叫嵌入式應(yīng)用，實(shí)際上就是Copilot，即駕駛輔助的角色。這個(gè)模型非常簡單，在底層基礎(chǔ)能力的加持下，在中間這層AI編排的機(jī)制下，再往上走，就可以提供一個(gè)Copilot服務(wù)，再加上插件的應(yīng)用，就可以應(yīng)用在現(xiàn)有的系統(tǒng)，只要有插件就可以方便地把數(shù)據(jù)接入進(jìn)來，相當(dāng)于在原有的系統(tǒng)之外構(gòu)建了一個(gè)輔助駕駛。

微軟的系統(tǒng)為什么發(fā)展得這么快？就是利用了這套架構(gòu)。當(dāng)然也有插件，我們覺得OpenAI的插件系統(tǒng)未來會(huì)改變商業(yè)模式和游戲規(guī)則。如果你們用過微軟最新的必應(yīng)搜索就可以發(fā)現(xiàn)，在對話過程中它可以跟網(wǎng)站交互獲取大量實(shí)時(shí)數(shù)據(jù)。以后必應(yīng)會(huì)改變整個(gè)應(yīng)用的生態(tài)和游戲規(guī)則。

在此基礎(chǔ)之上，我們怎么看這個(gè)世界？

第一，GPT背后，一部分是技術(shù)的加持，另一部分是人才、資源、文化。這一點(diǎn)說明我們離不開企業(yè)非常優(yōu)秀的數(shù)據(jù)，離不開這些技術(shù)模型。但同時(shí)，我特別想強(qiáng)調(diào)一點(diǎn)，如果我們這個(gè)公司的人沒有開放的心態(tài)去擁抱新技術(shù)、擁抱新產(chǎn)品，那這個(gè)事情可能也做不了。ChatGPT之所以成功，它是源自于這三方面的成果。這一點(diǎn)，我想，對很多企業(yè)可能有一定思考價(jià)值。有了最新的技術(shù)，有了非常良好的數(shù)據(jù)，但如果企業(yè)沒有這樣的文化，可能也是有問題的。

第二，大模型要實(shí)現(xiàn)平民化。OpenAI就是想讓AI真正Open，讓邊際成本急劇降低。2012年以后，人工智能興起，深度學(xué)習(xí)興起，但那時(shí)候每一個(gè)SKU（最小存貨單位Stock Keeping Unit，比如銷量數(shù)據(jù)都是以SKU為單位收集，建立預(yù)測模型就要為每個(gè)SKU單獨(dú)訓(xùn)練一個(gè)模型）都要單獨(dú)去做訓(xùn)練，我們做了太多的項(xiàng)目都是這樣，成本很高。但是新的AIGC（人工智能生成內(nèi)容）的模型是通用化的模型，降低再訓(xùn)練的成本，實(shí)際上是把邊際成本急劇降低。只有當(dāng)大家都能用的時(shí)候，才能說這是人工智能時(shí)代，如果只有少數(shù)人在用，那不叫一個(gè)時(shí)代。

微軟也是這么做的，M365（Microsoft 365，基于Microsoft Office 辦公室套件的云端辦公室方案）就是用這個(gè)方法來實(shí)現(xiàn)的。在原來微軟的Office加了一個(gè)Copilot，左下角有一個(gè)Graph（存儲(chǔ)了電子郵件、文件會(huì)議、聊天和日歷筆記等office辦公軟件集合的所有內(nèi)容），相當(dāng)于M365下的知識(shí)庫，通過中間的Copilot能夠迅速構(gòu)建知識(shí)庫和文檔之間的合作關(guān)系。這樣可以實(shí)現(xiàn)，在Windows文檔中輸入幾句話，比如簡要概述一下研究報(bào)告的核心思想，就可以把報(bào)告總結(jié)成5頁P(yáng)PT。等它正式上線以后，大家可以體會(huì)一下，會(huì)急劇提高生產(chǎn)力。

最根本來說，它就是把人不擅長的事情機(jī)器化了。我們知道人在面對自己解決不了的問題時(shí)，一定要求助于工具，生活中是這樣，IT行業(yè)也是這樣，讓人類教會(huì)機(jī)器來做人類不擅長的事情。我想引用管理學(xué)大師德魯克先生（彼得·德魯克）的一句話，動(dòng)蕩時(shí)代的最大風(fēng)險(xiǎn)不是動(dòng)蕩本身，而是企圖以昨天的邏輯來應(yīng)對動(dòng)蕩。

標(biāo)簽：

關(guān)閉

微軟崔宏禹：GPT-4以后，不建議再用微調(diào)進(jìn)行模型適配

相關(guān)推薦

精彩組圖

精彩放送

微軟崔宏禹：GPT-4以后，不建議再用微調(diào)進(jìn)行模型適配

數(shù)博會(huì)上的“黑科技”

渤海灣首個(gè)千億方大氣田中心平臺(tái)建造完成_當(dāng)前看點(diǎn)

為了“蟲口奪糧” 這群博士給蟲子拍“寫真”進(jìn)行“蟲臉識(shí)別”|世界快播報(bào)

何小鵬破局 “小循環(huán)”：降本、G6、保供

相關(guān)推薦

精彩組圖

精彩放送

何小鵬破局 “小循環(huán)”：降本、G6、保供