編譯 | 來咖智庫 豆豆
編輯 | 龔巖
科技不時會激發(fā)全世界的想象力,最新的例子就是ChatGPT。這可以從充斥于硅谷、華爾街、把角辦公室、新聞編輯室和教室里的閑言碎語來判斷。
自從去年11月由初創(chuàng)公司OpenAI發(fā)布后,ChatGPT人工智能聊天機(jī)器人(AI Chatbot)在前五天就吸引了100萬名用戶,成為有史以來被最快接受的消費(fèi)產(chǎn)品。微軟公司剛剛在OpenAI投資了100億美元,希望在其自身銷售的軟件中,植入ChatGPT這樣以假亂真模擬人類創(chuàng)作文本、圖像和視頻的能力。
1月26日,Google發(fā)布了論文,描述了一種類似的模型,能夠根據(jù)歌曲的文字描述創(chuàng)作音樂。Google母公司Alphabet的投資人在密切關(guān)注其如何應(yīng)對ChatGPT的挑戰(zhàn)。中國搜索巨頭百度據(jù)傳也計劃于3月在搜索引擎中加入聊天機(jī)器人的功能。
談?wù)撨@些早期熱潮是否合理還言之尚早。暫且不論ChatGPT及其競爭對手背后的這些“生成式”人工智能模型改變商業(yè)、文化和社會的程度,它們已經(jīng)在改變科技行業(yè)對于創(chuàng)新及其引擎的認(rèn)識了。像OpenAI和Google Research這樣的公司研發(fā)實驗室,正在把大科技的處理能力與計算機(jī)科學(xué)中最明亮的一些腦力火花結(jié)合起來。這些競爭實驗室——無論它們是深處大科技公司內(nèi)部,與其有關(guān)聯(lián),還是由獨(dú)立初創(chuàng)公司運(yùn)營——都在參與一場對于人工智能霸權(quán)史詩般的競賽。這場競賽的結(jié)果將決定全世界的計算機(jī)用戶多快能見到人工智能時代的曙光,以及將由誰來統(tǒng)治。
尤其是在美國,公司研發(fā)機(jī)構(gòu)長期以來都是科學(xué)進(jìn)步的來源。一個半世紀(jì)以前,托馬斯·愛迪生使用其留聲機(jī)、燈泡等發(fā)明帶來的資金,運(yùn)作其在新澤西Menlo Park的工作室。二戰(zhàn)后,美國公司在基礎(chǔ)科學(xué)方面投入巨大,希望能夠研發(fā)出實用的產(chǎn)品。杜邦(化工產(chǎn)品制造商)、IBM和施樂(均為硬件廠商)等均組建了大型研發(fā)實驗室。AT&T的貝爾實驗室生產(chǎn)出晶體管、激光和光伏電池等產(chǎn)品發(fā)明,其研發(fā)人員獲得過9項諾貝爾獎。
然而,到了20世紀(jì)晚期,公司研發(fā)部門慢慢地更專注于“開發(fā)”,而非“研究”。2017年,經(jīng)濟(jì)學(xué)家Ashish Arora及其同事們研究了1980到2006年這段時期,發(fā)現(xiàn)公司們從基礎(chǔ)科學(xué)研究轉(zhuǎn)向了開發(fā)已有成果。他們認(rèn)為,其中的原因在于研究成本上漲,以及從研發(fā)成果中獲取收益的難度加大。施樂開發(fā)了現(xiàn)在計算機(jī)用戶們熟悉的圖標(biāo)和窗口等,但卻是蘋果和微軟從中收獲最多??茖W(xué)對于創(chuàng)新仍然很重要,但其主要已成為非營利大學(xué)的領(lǐng)地。
人工智能的興起使形勢再一次變化。大公司已不再是一枝獨(dú)秀。Anthropic和Character AI等初創(chuàng)公司已經(jīng)打造出自身的ChatGPT挑戰(zhàn)者。初創(chuàng)公司Stability AI作為一些小企業(yè)、大學(xué)和非盈利機(jī)構(gòu)組成的共同體,已打造出一種流行的能把文本轉(zhuǎn)成圖像的模型。中國政府資助的智源研究院(BAAI)等機(jī)構(gòu)也十分出色。
但最近全球幾乎所有人工智能方面的突破都來自于巨頭公司,一方面是由于它們有計算機(jī)算力,另一方面該領(lǐng)域的基礎(chǔ)研究成果難得地可以被迅速融入產(chǎn)品。亞馬遜將人工智能應(yīng)用于Alexa語音助手,Meta(Facebook母公司)的一個模型最近在Diplomacy桌面策略游戲中擊敗了人類選手引發(fā)關(guān)注。前述兩家公司比(計算機(jī)科學(xué)學(xué)霸集中營)斯坦福大學(xué)在人工智能方面的研發(fā)成果還分別要高三分之二和五分之四。Alphabet(Google母公司)和微軟的成果更豐富,這還不包括Google Research的兄弟實驗室——Alphabet在2014年收購的DeepMind,以及微軟的關(guān)聯(lián)公司OpenAI。
至于哪家處于領(lǐng)先位置,專家們的觀點(diǎn)并不一致。例如,中國的實驗室看來在計算機(jī)視覺子學(xué)科方面已取得大幅領(lǐng)先,它們在圖像分析方面的論文被引用得最多。根據(jù)微軟開展的排名,全世界前五名計算機(jī)視覺團(tuán)隊都是中國的。智源研究院也自稱打造了全球最大的自然語言模型——“悟道2.0”。Meta選手Cicero由于在Diplomacy游戲中開展策略推演和欺騙人類對手等廣受贊譽(yù)。DeepMind的模型已經(jīng)在對于計算機(jī)最難的圍棋游戲中戰(zhàn)勝了人類冠軍,還能解決長期以來的生命科學(xué)難題——預(yù)測蛋白質(zhì)的形狀。
這些成就都令人驚嘆。然而,在談到目前最火的ChatGPT這類人工智能時,最大的戰(zhàn)役爆發(fā)于微軟和Alphabet之間。有人把基于OpenAI的GPT-3.5模型和Google尚未發(fā)布的基于LaMDA模型的聊天機(jī)器人進(jìn)行了比較,各問了它們一些問題。其中包括從美國數(shù)學(xué)競賽中選取的10個問題(“和為60的質(zhì)數(shù)對數(shù)量有多少個”),從美國SAT考試中選取的10個閱讀問題(“閱讀該段文字,選擇最能夠描述其中事件的選項”)。為了增加趣味,還分別向它們請教了約會建議(“根據(jù)下列約會應(yīng)用中的對話,提出首次約會的最佳方式是什么?”)。
兩個人工智能都沒能顯著領(lǐng)先對方。Google的數(shù)學(xué)較好,答對了5個問題,ChatGPT對了3個。它們給出的約會建議不太一致:輸入約會應(yīng)用中的一些真實對話后,兩者均就一個場景給出具體建議,對于另一個則只有“保持開放心態(tài)”、“進(jìn)行有效溝通”等陳詞濫調(diào)。在SAT問題方面,ChatGPT正確回答了9個問題(對手Google答對了7個),對于提問者反饋的響應(yīng)度更好,且再次嘗試時可以修正一些答案。1月30日,OpenAI宣布升級ChatGPT以改善其數(shù)學(xué)能力。當(dāng)對兩個人工智能提出10個新問題時,LaMDA再次比對手多得了2分。但如果允許修正答案的話,ChatGPT能與對手打成平手。
至少在目前為止,沒有模型能夠取得無法撼動的領(lǐng)先優(yōu)勢,原因是人工智能知識傳播得很快。Stability AI的David Ha指出,相互競爭實驗室的研究人員“經(jīng)?;煸谝黄稹?。與曾在Google工作的Ha先生一樣,很多人在機(jī)構(gòu)間攜帶著專業(yè)技術(shù)和經(jīng)驗跳來跳去。此外,由于最好的人工智能專家在內(nèi)心深處都是科學(xué)家,他們經(jīng)常把能夠持續(xù)發(fā)布研究論文和在會議上展示研究成果作為屈就于私營部門的前提條件。這在一定程度上促使Google公布了一些重大進(jìn)展,包括人工智能模型的關(guān)鍵基礎(chǔ)要素“Transformer”,為對手提供了幫助(GPT里面的T指得就是“Transformer”)。由此,Meta的頂尖人工智能研究員Yann LeCun認(rèn)為,“沒有人能夠領(lǐng)先其他對手2-6個月以上”。
但這些只是早期的情況。這些實驗室也許不會永遠(yuǎn)并駕齊驅(qū)下去。Google據(jù)傳已經(jīng)發(fā)布了“紅色警報”,擔(dān)心ChatGPT將能夠提升來自微軟的競爭對手搜索引擎Bing。DeepMind的研究人員說該公司以前聚焦于游戲和科學(xué),現(xiàn)在正把資源投入語言建模,可能于年內(nèi)發(fā)布其名為Sparrow的聊天機(jī)器人。
可能有助于判斷競賽最終勝者的一個變量是實驗室的組織方式。OpenAI作為一家沒有什么收入流需要保護(hù)的小公司,也許會發(fā)現(xiàn)自己有更大空間向公眾發(fā)布產(chǎn)品。這會帶來大量的用戶數(shù)據(jù),使其模型變得更好(“基于人類反饋的強(qiáng)化學(xué)習(xí)”),并因此吸引更多用戶。
這種先發(fā)優(yōu)勢還可能在另一個方面自我強(qiáng)化。內(nèi)部人士指出,OpenAI近年的快速發(fā)展使其能夠從DeepMind等競爭對手處挖來專家。要想緊追不舍,Alphabet、亞馬遜和Meta也許要重拾其快速行動、分解實施的能力,這在其經(jīng)受全球各地政府深入監(jiān)管審查的背景下很難實現(xiàn)。
另一個決定性因素也許是科技發(fā)展的路徑。到目前為止,對于生成式人工智能,越大就意味著越美,這給有錢的科技巨頭們帶來巨大優(yōu)勢。但在未來,規(guī)模也許不再意味著一切。例如,模型能夠變多大是有限度的。據(jù)非營利性研究所Epoch預(yù)計,按照現(xiàn)在的速度,大語言模型將把高質(zhì)量網(wǎng)絡(luò)文本用完(盡管視頻等形態(tài)還將在一段時間內(nèi)有富余)。Stability AI的Ha先生指出,更重要的是,有辦法可以對具體任務(wù)的模型進(jìn)行微調(diào),“大幅降低擴(kuò)大模型的必要性”。人們也一直在探索以小博大的創(chuàng)新方法。
去年,共有27億美元資本流入生成式人工智能初創(chuàng)公司,達(dá)成110筆交易。這意味著風(fēng)險投資家們在賭大科技公司們無法獲取該行業(yè)的全部價值。當(dāng)然,Alphabet、微軟和其他科技巨頭們將試圖證明這些投資者們是錯的。人工智能的競賽才只是剛剛開始。