天天亮點!Siri們被調(diào)侃為“人工智障”,ChatGPT能拯救語音助手嗎?

2023-03-18 08:58:58

·Siri、Alexa和其他語音助手也曾在公眾中引發(fā)過類似ChatGPT的熱情,但在過去十年里,它們浪費了在人工智能競賽中的領先機會。

·Siri的聯(lián)合創(chuàng)始人亞當·切耶說,生成式人工智能有可能使語音助手回到最初的科幻軌道上?!拔掖_實認為這與質(zhì)量有關?!彼f,“從根本上說,這項技術將實現(xiàn)上一代語音助理所沒有的廣度、靈活性和復雜性。我認為會出現(xiàn)復興。”


(相關資料圖)

隨著與ChatGPT的開發(fā)機構OpenAI的合作成果良好,微軟似乎越來越有自信,近日,微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在接受英國《金融時報》采訪時表示,語音助手“笨得像塊石頭”,“無論是Cortana、Alexa、谷歌助理(Google Assistant)還是Siri,所有這些都不起作用。”他宣稱,新型人工智能將引領潮流。

十多年來,盡管科技巨頭一直在嘗試各類語音助手,但事實卻表明,蘋果的Siri、亞馬遜的Alexa以及谷歌助理都發(fā)展不順利,在中國,一批類似的產(chǎn)品也陷入了尷尬境地。《紐約時報》首席消費科技作者布萊恩·陳(Brian X. Chen)評論道,語音助手過去遇到了發(fā)展瓶頸,正因如此給了AI聊天機器人崛起的空間,讓微軟和OpenAI在人工智能競賽中遙遙領先。

那么,蘋果、亞馬遜和谷歌是如何輸?shù)暨@一輪人工智能競賽的?

誤入歧途的語音助手

12年前一個雨天,蘋果公司(Apple)的高管們在一個擁擠的禮堂登臺發(fā)布iPhone 4s.這款手機看起來和之前的版本沒什么區(qū)別,但有一個新功能很快就引起了觀眾的熱議:語音助手Siri。

時任蘋果軟件主管的斯科特·福斯特爾(Scott Forstall)按下iPhone上的一個按鈕,召喚出了Siri,并向它提問。在他的要求下,Siri查看了巴黎的時間,定義了“有絲分裂”,并列出了14家評級較高的希臘餐廳,其中5家位于加州帕洛阿爾托。

“我在人工智能領域工作了很長時間,這仍然讓我大吃一驚。”福斯特爾當時說。

如今,Siri早已成為被調(diào)侃為“人工智障”的對象。Siri的聯(lián)合創(chuàng)始人亞當·切耶(Adam Cheyer)告訴《金融時報》,ChatGPT理解復雜指令的能力,讓現(xiàn)有的語音助理看起來相對愚蠢?!爸暗哪芰μ珜擂瘟?。”他說,“沒有人知道它們能做什么或不能做什么。它們不知道自己能說什么或不能說什么?!?/p>

其他語音助手的技術也一直停滯不前,成為被取笑的對象。亞馬遜搭載Alexa的智能音箱Echo甚至作為笑點出現(xiàn)在2018年《周六夜現(xiàn)場》(Saturday Night Live,美國脫口秀節(jié)目)的小品中,而最初,亞馬遜創(chuàng)始人杰夫·貝索斯(Jeff Bezos)曾經(jīng)在白板上興奮地勾勒出他對Alexa的愿景:網(wǎng)上購物,控制小工具,甚至給孩子們讀睡前故事。

事實上,Siri、Alexa和其他語音助手也曾在公眾中引發(fā)過類似ChatGPT的熱情,但在過去十年里,它們浪費了在人工智能競賽中的領先機會。

前員工表示,亞馬遜和谷歌錯誤地估計了語音助手的使用方式,導致他們投資了一些很少有回報的領域。當這些嘗試失敗后,公司對這項技術的熱情就減弱了。

2014年,亞馬遜發(fā)布Echo,希望該產(chǎn)品能夠讓消費者通過與Alexa對話來下單,從而幫助其增加在線商店的銷量。但一位參與Alexa的前亞馬遜高管表示,雖然人們很享受Alexa回答天氣提示和設置鬧鐘的功能,但很少有人用Alexa訂購商品。

亞馬遜智能音響Echo嵌入了語音助手Alexa。

這位前高管表示,亞馬遜可能在制造新型硬件方面投資過度,比如現(xiàn)已停產(chǎn)的與Alexa兼容的鬧鐘和微波爐,這些產(chǎn)品的售價低于或等于成本。

此外,他表示,亞馬遜在創(chuàng)建一個讓人們輕松擴展Alexa功能的生態(tài)系統(tǒng)方面投資不足,雖然亞馬遜的商店也提供Alexa相關的第三方插件,但設置和使用十分困難,這與從應用商店下載應用程序的順暢體驗完全不同。

去年年底,亞馬遜負責Alexa的部門是該公司18000人裁員的主要目標,一些Alexa高管已經(jīng)離開了公司。

一位曾在“谷歌助理”工作的前經(jīng)理表示,亞馬遜在Alexa上的失敗可能導致谷歌誤入歧途。谷歌的工程師花了數(shù)年時間對其語音助手進行試驗,以模仿Alexa的功能,包括設計智能揚聲器和聲控平板電腦屏幕,以控制恒溫器和電燈開關等家用電器。該公司后來將廣告整合到這些家居產(chǎn)品中,但這并沒有成為主要的收入來源。

隨著時間的推移,谷歌意識到大多數(shù)人只將語音助手用于數(shù)量有限的簡單任務,例如啟動計時器和播放音樂。2020年,當谷歌高管普拉巴卡·拉加萬(Prabhakar Raghavan)接管“谷歌助理”時,他的團隊將這個虛擬伴侶重新定位為Android智能手機的附屬功能。今年1月,當谷歌的母公司解雇了12000名員工時,負責家庭設備操作系統(tǒng)的團隊失去了16%的工程師。6月,它將終止專門為其語音助理制作的第三方“對話操作”的訪問。

和ChatGPT基于不同技術

這些語音助理產(chǎn)品和類似ChatGPT的聊天機器人雖然功能類似,但本質(zhì)上基于不同類型的人工智能模型。聊天機器人由大型語言模型提供動力,這些模型是經(jīng)過訓練的系統(tǒng),能夠根據(jù)從網(wǎng)絡上抓取的大量數(shù)據(jù)集識別和生成文本。

相比之下,Siri、Alexa和“谷歌助理”則通過所謂的指揮控制系統(tǒng)進行工作。它們可以理解有限的問題和請求列表,比如“紐約市的天氣怎么樣?”或“打開臥室的燈”。如果用戶要求虛擬助手做一些代碼中沒有的事情,機器人會簡單地說它無法提供幫助。

這幾家公司都嘗試過將語音助手進行升級,但該類技術的升級難度似乎遠超生成式人工智能,曾參與Siri開發(fā)的蘋果前工程師約翰·伯基(John Burkey)說,Siri的設計很繁瑣,增加新功能也很費時間。2014年,他受命改進Siri,但發(fā)現(xiàn)Siri的數(shù)據(jù)庫包含一個巨大的單詞列表,他說,這就形成了“一個大雪球”。如果有人想在Siri的數(shù)據(jù)庫中添加新詞,代碼會“越滾越多”。

因此,看似簡單的更新,比如向數(shù)據(jù)集中添加一些新短語,就需要重建整個數(shù)據(jù)庫,這可能需要長達六周的時間。添加更復雜的功能,比如新的搜索工具,可能需要將近一年的時間。他說,這意味著Siri不可能通過升級成為下一個ChatGPT。

相比之下,蘋果的處境還好一些,他們利用Siri吸引了消費者購買iphone.而亞馬遜和谷歌的前高管則表示,Alexa和“谷歌助理”依賴于與Siri類似的技術,但這兩家公司很難通過這些語音助手產(chǎn)生有意義的收入。

谷歌助手被嵌入在該公司的家庭設備中,如谷歌家庭迷你智能音箱。

在中國,市面上主要有小愛同學、小度、天貓精靈等主流的AI語音助手,被用在手機、電腦、電視、音箱等多種電子產(chǎn)品上,也是連接各種智能家居產(chǎn)品的中樞。但是,其用戶體驗卻備受詬病,比如識別度不高、數(shù)據(jù)庫不夠完善,很多產(chǎn)品在用戶家中處于半閑置狀態(tài)。

語音助手準備如何“翻盤”?

根據(jù)布萊恩·陳的說法,盡管微軟現(xiàn)在在創(chuàng)新競賽中搶占了領先地位,但谷歌仍緊隨其后。秉著“打不過就加入”的原則,將生成式人工智能帶來的搜索引擎領域的技術進步引入語音助手,可能只是時間問題。

一些人工智能專家也表示,在未來,聊天機器人和語音助手的技術將會融合。這意味著人們能夠通過語音控制聊天機器人,要求虛擬助手幫助他們完成工作,而不僅僅是查看天氣等簡單任務。

最近,這些大型科技公司都在競相對ChatGPT做出回應。2月,蘋果在總部舉行了年度人工智能峰會,這是一個內(nèi)部活動,讓員工了解其大型語言模型和其他人工智能工具,兩名了解該項目的人士說,Siri團隊成員在內(nèi)的許多工程師每周都在測試語言生成功能。

科技媒體Techradar表示,蘋果雖然沒有發(fā)布新的語音助手,但這可能只是在等待時機,然后再出手奪回人工智能陣地。一些敏銳的用戶已經(jīng)在將ChatGPT嵌入Siri,用戶這種增強Siri功能的渴望也是蘋果可以利用的潛力。

Siri等語音助手們距離“聽懂人話”還有距離。近日,國外一名博主成功將ChatGPT接入Siri,打造出了聊天機器人+虛擬助手的夢之隊。(02:57)

此前,谷歌已經(jīng)發(fā)布了聊天機器人巴德(Bard),3月14日,谷歌表示它將很快發(fā)布生成式人工智能工具,幫助企業(yè)、政府和軟件開發(fā)人員構建帶有嵌入式聊天機器人的應用程序,并將底層技術整合到他們的系統(tǒng)中。

3月16日,百度開放大模型“文心一言”的測試。百度創(chuàng)始人、董事長兼CEO李彥宏表示,百度將在所有業(yè)務中全面集成文心一言,包括與語音助手小度進行集成,升級小度智能設備和服務。

AI初創(chuàng)公司Perplexity的創(chuàng)始人Aravind Srinivas說:“這些產(chǎn)品過去從未有效,因為我們從未擁有人類層面的對話能力?!薄艾F(xiàn)在我們做到了?!?/p>

Siri的聯(lián)合創(chuàng)始人切耶說,生成式人工智能有可能使語音助手回到最初的科幻軌道上?!拔掖_實認為這與質(zhì)量有關。”他說,“從根本上說,這項技術將實現(xiàn)上一代語音助理所沒有的廣度、靈活性和復雜性。我認為會出現(xiàn)復興?!?/p>

(文章來源:澎湃新聞)

標簽:

關閉
新聞速遞