文|數(shù)智商業(yè)秀 數(shù)智君
編輯|楊肖若
谷歌一頓操作猛如虎,組合“反擊”重磅降臨。
北京時間5月11日凌晨,在谷歌2023年的I/O開發(fā)者大會上,其發(fā)布了全新一代的大語言模型PaLM 2以及生成式AI能力的“試驗版”谷歌搜索和智能云等產(chǎn)品。
這堪稱一次相當驚艷的“組合炸彈”式轟炸,被很多媒體和網(wǎng)友吹爆了。很快,資本市場也快速響應,截止發(fā)稿,谷歌的股價上漲超過4%。
谷歌的這一番操作,著實令人驚嘆:人工智能將會對我們的工作和生活產(chǎn)生如此影響!甚至也有網(wǎng)友稱:這是否也意味著全球范圍內(nèi)的AI大戰(zhàn)全面開啟?
確實,在ChatGPT和New Bing先后拋出各自的“殺手锏”之后,Google的這套“組合”式“轟炸”,非常有理由被看作是其在進行重磅反擊。
彷佛一夜之間,谷歌的操作既證明了自己,又在AI群隔空@了所有人,大戰(zhàn)全面開啟。
如果確認這場大戰(zhàn)已經(jīng)開始,主角自然包括了國內(nèi)正在日夜兼程推出和迭代大模型的科技巨頭們,也包括人類自己,沒人能逃離這場“大戰(zhàn)”的影響。
01 谷歌扔了一個重磅組合式“炸彈”
如同谷歌CEO皮查伊描述的那般——繼“忙碌的一年”之后,谷歌終于等來了收獲的季節(jié)。
在發(fā)布會上,皮查伊表示,此次谷歌發(fā)布的PaLM 2是目前最先進的語言模型,同時這也是PaLM語言模型的第二個版本。
“與PaLM 1相比,PaLM 2有了顯著提升?!惫雀韪呒壯芯靠偙O(jiān)斯拉夫·彼得羅夫(Slav Petrov)說。
皮查伊具體稱,“PaLM 2在邏輯和推理方面進行了廣泛的訓練,具有極強的邏輯和推理能力?!?/p>
我們知道,ChatGPT-4作為其中知名的一個代表大模型,其功能的強大已無需贅言,尤其是在邏輯推理和數(shù)學表現(xiàn)層面。
但據(jù)谷歌的官方測試,PaLM2的部分結果(例如數(shù)學)比GPT-4還要好。谷歌稱,對PaLM2做了算法優(yōu)化,使得它在體積上比PaLM要小,但整體性能更好,計算效率更高。
具體而言,在多語言能力方面,PaLM 2進行了更多訓練,文本橫跨100多種語言,很大程度上提高了其理解、生成和翻譯細微差異化文本的能力,解決了對成語、詩歌和謎語這類文本的理解能力,畢竟這種文本的處理門檻較高。
此外,PaLM 2還能通過很高級別的語言能力考試。
在推理能力方面, 由于PaLM 2在包含科學論文和數(shù)學表達式的網(wǎng)頁上進行了訓練,因此具備了在邏輯、常識推理和數(shù)學方面的改進能力。
在編碼能力上,PaLM 2支持20多種編程語言。由于它是在大量公開可用的源代碼數(shù)據(jù)集上進行預訓練,因而擅長Python和JavaScript等流行編程語言,同時也可進行Prolog、Fortran和Verilog等小眾語言的編程。
對于PaLM 2,谷歌工程師在一份研究論文中稱,該系統(tǒng)的語言熟練程度“足以教授這門語言”?!芭c其他大型語言模型一樣,PaLM2與其說是一款單一產(chǎn)品,不如說是一系列產(chǎn)品,它擁有不同的版本,可部署在消費者和企業(yè)環(huán)境中。”谷歌工程師稱。
據(jù)了解,PaLM 2已被用于支持自家的25項功能和產(chǎn)品,其中包括AI聊天機器人Bard以及谷歌文檔、幻燈片和工作表等等。
在此次大會上,谷歌還通過將生成式AI生成的結果,嵌入到搜索結果顯示頁中,向外界展示了不同于ChatGPT的新式搜索顯示效果,這也是谷歌在重構搜索層面的一大進展。
在現(xiàn)場,谷歌搜索副總裁利茲·里德(Liz Reid)打開筆記本電腦,在谷歌搜索框中輸入了一個問題——“對于有3歲以下孩子和狗的家庭來說,布萊斯峽谷或拱門哪個更好?”
當她敲下“回車鍵”,谷歌搜索立即給出了結果。同時緊隨在搜索結果下方,一個長方形的橙色部分閃閃發(fā)光,并顯示“生成式人工智能正在試用中?!?/p>
幾秒鐘后,發(fā)光部分被AI生成的摘要所取代,幾段話詳細分析了生成式AI的推理過程。在右邊還有三個網(wǎng)站的鏈接,幫助“證實”摘要中的內(nèi)容。
ChatGPT重構了微軟必應,Bard自然是基于 PaLM2 進行了迭代,形成了新的谷歌搜索。
當大語言模型PaLM 2接入Bard ,谷歌搜索能為用戶提供文字、圖片等多模態(tài)的邏輯整合版輸出結果。而且升級版的 Bard 所能支持的語言拓展至包括日韓語的 40 種語言。
更驚人的是,Bard還能給出自行車購買指引。
此前宣布接入GPT-4 的Office,讓微軟在辦公領域 “殺瘋”,而此次發(fā)布會,谷歌將升級版 Bard 也整合到了自家的辦公軟件 “全家桶” 中,包括 Gmail、谷歌 Docs(文檔)、Sheets(表格)及 Slides(幻燈片),也創(chuàng)造出了“Duet AI”辦公助手。
當然,此次除了發(fā)布AI內(nèi)容外,谷歌也發(fā)布了 Pixel Tablet 平板電腦、Pixel Fold 折疊屏手機、Pixel 7a 手機等硬件新品,堪稱“實力全家桶”。
這次谷歌無疑在AI圈扔了一個重磅組合式“炸彈”,在牌桌上狠狠扳回一局。
02 谷歌的野心與低調(diào)
一直以來,外界認為谷歌其實在AI大模型這場較量中失去了先發(fā)優(yōu)勢。尤其是自2022年底開始,ChatGPT橫空出世后,谷歌就因此陷入被動的局面。
今年以來,ChatGPT-4的發(fā)布令谷歌的境地更加尷尬。
不過,谷歌實際上是將自己的野心深藏,保持低調(diào)。要知道,谷歌比OpenAI等更早看到超大規(guī)模語言模型的必要性,并堅持在稀疏模型架構上做深入探索。
谷歌的AI技術架構最早可追溯到2001年。
Jeff Dean被稱為“傳奇工程師”,他也是美國工程院院士,作為谷歌的20號員工,他創(chuàng)建了Google Brain,開發(fā)了谷歌機器學習開源框架TensorFlow,也是谷歌廣告系統(tǒng)、谷歌搜索系統(tǒng)等的重要創(chuàng)始人之一??梢哉f,他是谷歌的重要技術奠基人。
作為谷歌首席架構師、谷歌研究院高級研究員、谷歌人工智能團隊谷歌大腦(Google Brain)負責人,Jeff Dean曾稱,谷歌開始開始著手訓練大模型的時候,機器學習技術還沒有如今那么驚艷,對谷歌搜索的錯誤查詢進行糾正。
而在接下來的20年中,谷歌一直秉承著AI優(yōu)先理念,為業(yè)界貢獻了無數(shù)經(jīng)典模型。Jeff Dean將當時新的模型Pathways稱為“下一代AI架構”——只要訓練一個模型,就可以處理數(shù)以萬計的任務類型。
這個模型的邏輯簡單來說就是學習的是人類思考模式。傳統(tǒng)AI模型訓練后只能完成一個任務,而Pathways訓練一個模型,就可以處理成千上萬個任務。這被稱之為“AI大模型”技術。
通常來說,每次處理一個新的問題時都需要訓練一個新的AI模型,而這些數(shù)學模型的參數(shù)實際上是用隨機的權重進行初始化,然后使用標注數(shù)據(jù)進行訓練的。
據(jù)業(yè)內(nèi)人士稱,這種訓練方式對于數(shù)據(jù)的純凈度要求很高,而大模型通過模型自身的能力進行優(yōu)化,力求擁有計算和處理復雜數(shù)據(jù)的能力。
在那個時候,Pathways被稱為“下一代AI架構”并不為過,在早期AI通過特定數(shù)據(jù)在深度學習模型上訓練成熟之后,通過產(chǎn)業(yè)互聯(lián)網(wǎng)的“深度認知”訓練進一步增強能力。
所以從底層技術的角度看,谷歌早早就通過AI大模型的創(chuàng)新,在布局下一個科技時代。
到2022年,Google發(fā)布了Pathways AI 架構的大模型(Pathways Language Model),簡稱為 PaLM。而此次發(fā)布會上發(fā)布的PaLM 2,恰恰是PaLM語言模型的第二個版本。
谷歌CEO皮查伊表示,這是目前最先進的語言模型。在DeepMind與谷歌分治之前,其語言模型麻雀就走上了小模型參數(shù)打敗精調(diào)的道路,而與谷歌合兵一處之后,勢必在思路上對PaLM 2也做出了相當貢獻。
皮查伊也強調(diào),“PaLM 2的成果建立在谷歌大腦和DeepMind這兩個世界級研究團隊所取得的進展之上?!?/p>
不過,Jeff Dean這次沒有亮相發(fā)布會,也給外界留下了一個神秘謎團。
03 AI大戰(zhàn)全面開啟?
雖說發(fā)布有先后,伴隨著外界對后來者的期望越來越高,但這也意味著,繼谷歌之后,全球的AI大戰(zhàn)全面拉響。
不知在谷歌祭出殺手锏之后,微軟和OpenAI又會如何回應?但或許,未來生命研究所和“ChatGPT之父”更早一些的行為和回應,足以說明了一切。
今年的3月29日,未來生命研究所(Future of Life Institute)3發(fā)布了一封題為《暫停巨型AI實驗》的公開信,呼吁所有AI實驗室立即暫停訓練比GPT-4更強大的AI系統(tǒng),至少6個月。
其中包括“人工智能教父”的杰弗里·辛頓、“鋼鐵俠”馬斯克等在內(nèi)的1110多名專業(yè)人士簽署了這封公開信。
近日,在麻省理工學院舉辦的“The Future of Business with AI”論壇上,OpenAI的首席執(zhí)行官Sam Altman首次回應了《暫停AI巨型實驗》的公開信。
“我們目前沒有訓練 GPT-5,也不會在短期內(nèi)進行訓練?!卑凑者@位“ChatGPT之父”的說法,“建更大的模型,喂更多的數(shù)據(jù)”已經(jīng)不能奏效,GPT-4的硬件條件也到了天花板。
但自ChatGPT發(fā)布以來掀起的科技軍備戰(zhàn),其實一直沒有停息,其余威在國內(nèi)愈演愈烈,各公司在AI領域卷個不停,大模型集中爆發(fā),被媒體評價為“頗有十年前‘百團甚至千團大戰(zhàn)’的氣勢”。
最近半年以來,科技巨頭玩家們的確都在摩拳擦掌、低調(diào)蓄力,不知何時這些瘋狂的技術巨頭就拋出一個個“殺手锏”。
國內(nèi)也在暗暗“較勁”扳手腕,相比此前數(shù)千家團購賽道玩家瘋狂燒錢,每一位“百模大戰(zhàn)”的參與者都在爭奪時間,試圖讓自己提前出線。
據(jù)不完全統(tǒng)計的公開數(shù)據(jù),在ChatGPT發(fā)布后的短短4個月時間里,至少已經(jīng)有30個國內(nèi)研發(fā)機構和企業(yè),在ChatGPT發(fā)布之后紛紛推出自己品牌的大模型與相關產(chǎn)品。
一時間,整個科技圈 “類ChatGPT”比比皆是,聲稱“國內(nèi)首發(fā)”的企業(yè)更是不少,資本市場聞風而動、風起云涌。
最近,繼百度、阿里巴巴、商湯科技等大廠紛紛發(fā)布大模型之后,科大訊飛于5月6日推出了旗下的訊飛星火認知大模型。同時,大訊飛星火認知大模型面向教育、辦公、汽車、數(shù)字員工等行業(yè)的解決方案也對外亮相。
一時間,大模型的報道鋪天蓋地,隨后陷入短暫的沉寂。而下一波,大概率正在來的路上。
或許,人類是時候可以停下來問問自己這些問題:
·我們是否應該讓機器用宣傳和虛假信息淹沒我們的信息渠道?
·我們是否應該自動化所有工作,包括令人滿意的工作?
·我們是否應該開發(fā)非人類思維,這些思維可能最終比我們更多、更聰明,甚至最終取代我們?
·我們是否應該冒險失去對文明的控制?
可以想到,人工智能已經(jīng)引起了人們的擔憂,未來的進步肯定也會帶來更多問題,所以對人工智能長期安全的焦慮,也是有必要的。更重要的是,它的短期影響也不容忽視。
在谷歌的發(fā)布會上,谷歌研究部副總裁左賓·蓋若曼尼指出了一個值得關注的問題,即模型并不是“越大越好”那么簡單,研究的創(chuàng)造性才是建立偉大模型的關鍵。
他表示,谷歌近期在構建和訓練模型方面取得的進展使之了解到如何真正釋放多模態(tài)能力,如何比以往更有效地構建模型。此后,谷歌會致力于那些為人們的日常生活帶來真正好處的模型構建。
為人類生活創(chuàng)造美好的科技社會,我們?nèi)祟愔辽賾撟鳇c什么。