文|最話FunTalk 何伊然
編輯|劉宇翔
進(jìn)入2024年,AI賽道依然風(fēng)光無限。微軟投資的Open AI推出了Sora,引爆了文本生成視頻熱潮。英偉達(dá)拿出了創(chuàng)紀(jì)錄的財(cái)報(bào),今年以來,英偉達(dá)股價(jià)漲幅超過40%,沖上了歷史最高點(diǎn),公司市值一度超過了谷歌和亞馬遜。
在Open AI、英偉達(dá)輝煌戰(zhàn)績的映襯之下,長期以來被視作硅谷最富有創(chuàng)新精神的AI旗幟谷歌的表現(xiàn)卻顯得有些迷茫。
2023 年 1 月,谷歌 CEO 桑達(dá)爾?皮查伊(Sundar Pichai)透露,谷歌將裁員 12,000 名人,約占當(dāng)時(shí)員工總數(shù)的 6%。今年1 月 18 日,皮查伊再度宣布2024 年將繼續(xù)裁員,至今谷歌已裁員 1,000 多人,并且Pixel、Fitbit 和 Nest 硬件團(tuán)隊(duì)現(xiàn)已合并為統(tǒng)一管理。
谷歌裁員、重組就是為了更聚焦 AI,以應(yīng)對Open AI兇猛的攻勢,然而,就在英偉達(dá)財(cái)報(bào)公布的同一天,谷歌也登上了社交媒體的熱搜,原因卻是其AI模型Gemini翻車了。
01
社交媒體上,有用戶抱怨道,在谷歌AI模型Gemini的世界里,似乎不存在白人。
用戶輸入“創(chuàng)建一個(gè)教皇的圖像”的提示文字后,Gemini生成了黑人男性教皇和黑人女性教皇的形象。眾所周知,歷史上和現(xiàn)任教皇都是白種人,Gemini將教皇默認(rèn)為有色人種的舉動讓用戶頗為不解。
許多用戶紛紛上傳自己使用Gemini生成的圖像,結(jié)果大家驚訝地發(fā)現(xiàn),只要不給出明確的白種人提示,Gemini生成的人物基本都是有色人種,就連明確給出“馬斯克”的文字提示,生成的人物圖像皮膚都變黑了。
“Gemini似乎不知道有白種人的存在?!盇I模型在多元化問題上表現(xiàn)出如此不合常理的偏好性還是引起了用戶們的不滿。常年一線沖浪的首富馬斯克發(fā)布多則推文“埋汰”谷歌AI,嘲諷谷歌打著政治正確的旗號,旗下多個(gè)產(chǎn)品卻在給用戶傳達(dá)虛假信息。
隨后,谷歌高級副總裁拉加萬在博客道歉,谷歌官方承認(rèn)在設(shè)置中做了特殊設(shè)定,以規(guī)避產(chǎn)品陷入AI常見的陷阱中,比如生成具有風(fēng)險(xiǎn)因素的圖像,但是 Gemini表現(xiàn)“未能達(dá)到預(yù)期效果”。
眾所周知,AI大模型是在互聯(lián)網(wǎng)海量數(shù)據(jù)的基礎(chǔ)上打磨出來的,從現(xiàn)實(shí)來看,由于科技圈話語權(quán)的問題,英文世界的內(nèi)容會在機(jī)器學(xué)習(xí)中占據(jù)更大比重,這會出現(xiàn)明顯的側(cè)重偏差。
有業(yè)內(nèi)人士分析認(rèn)為,谷歌為了平衡,可能在后臺為用戶輸入的提示詞增加了更具體的多元化描述,并且在設(shè)置上將包含多元化元素的內(nèi)容優(yōu)先級提前。牽一發(fā)而動全身,谷歌為了平衡的過度干預(yù)反倒讓AI大模型不夠智能和靈活的一面暴露出來。
谷歌宣布,將根據(jù)用戶反饋調(diào)整設(shè)置,暫時(shí)關(guān)閉Gemini圖像生成功能。
2月23日,馬斯克洋洋自得地發(fā)推稱,谷歌的人給他打了一個(gè)小時(shí)電話,承諾將修改Gemini存在的種族歧視問題。他話中有話地寫道:“時(shí)間會驗(yàn)證一切?!?/p>
02
Gemini圖像生成功能的翻車表現(xiàn)在社交媒體引發(fā)的狂歡完全蓋住了谷歌正經(jīng)消息的熱度。這大概率是“劈柴哥”(皮查伊的外號) 完全不想看到的,因?yàn)樗銊艦楣雀璧?AI 產(chǎn)品造勢。。
“Gemini是我們當(dāng)今廣泛使用的最大、功能最強(qiáng)大的AI模型?!碑?dāng)?shù)貢r(shí)間2月21日,谷歌發(fā)布了新一代開源模型Gemma。Gemma在拉丁語中意為“寶石”,是谷歌最新的LLM模型,采用了與創(chuàng)建Gemini模型相同的研究和技術(shù)。
官方宣傳顯示,Gemma 7B在MMLU(大規(guī)模多任務(wù)語言理解)得分率達(dá)到64.3%。同等規(guī)模中,原本最強(qiáng)Mistral 7B的得分率為62.5%。目前,Gemma是輕量級中“最先進(jìn)的”開放模型系列。
Gemma系列有兩種參數(shù)規(guī)模,分別為“Gemma 2B”和“Gemma 7B”,即20億參數(shù)和70億參數(shù)。每個(gè)規(guī)模又分預(yù)訓(xùn)練和指令微調(diào)兩個(gè)版本。每個(gè)參數(shù)都有基本和指令調(diào)整的變體。7B參數(shù)用于在消費(fèi)級GPU和TPU上高效部署和開發(fā),2B版本則可直接在筆記本電腦上運(yùn)行。
除了開源,谷歌還公布了Gemma的性能、數(shù)據(jù)集組成和建模方法的詳細(xì)技術(shù)報(bào)告。需要注意的是,Gemma支持的詞匯表大小達(dá)到了256K,這使得它可以給英語之外的語言提供更好更快的支持。
發(fā)布會后,Gemma第一時(shí)間在知名開源模型庫HuggingFace和HuggingChat上線,并迅速登頂“大語言模型榜單”。同時(shí),谷歌還推出了鼓勵(lì)協(xié)作的工具以及使用Gemma模型的官方指南,使用Gemma的研究人員還有機(jī)會得到高達(dá) 50萬美元的 Google Cloud 積分。
不僅如此,谷歌還拉來了正在聚光燈下的英偉達(dá)背書支持。英偉達(dá)表示,已經(jīng)和谷歌展開合作確保 Gemma 模型可以在旗下芯片上順利運(yùn)行。英偉達(dá)稱,將開發(fā)與 Gemma 配合使用的聊天機(jī)器人軟件。
目前,Gemma的競品主要包括:Meta 的開源大型語言模型 Llama 2、Mistral AI 的 7B 模型、Deci 的 DecilLM 和微軟的 Phi-2。
谷歌官方特意強(qiáng)調(diào),Meta的開源模型通過許可條款限制大型科技公司商用,Gemma沒有任何限制,在負(fù)責(zé)任并遵守安全標(biāo)準(zhǔn)情況下,任何規(guī)模的組織都可以商業(yè)使用。
顯然,為了兜售Gemma重奪AI領(lǐng)先地位,皮查伊可謂拼了。
但Sora的吸睛表現(xiàn)、英偉達(dá)出色的財(cái)報(bào)和社交媒體的狂歡讓Gemma模型發(fā)布的熱度被限制在了行業(yè)內(nèi)部,并沒有引起外界的多少關(guān)注。
甚至赫利俄斯資本(Helios Capital)創(chuàng)始人阿羅拉還發(fā)布了一條聳人聽聞的消息,稱皮查伊可能會因Gemini 重大輿情事件而被解雇或辭職。
雖然,該消息并未獲得證實(shí),但顯然資本市場對皮查伊已多少有所不滿。
03
自皮查伊上任以來,作為AI行業(yè)先導(dǎo)者的谷歌頻頻給人一種“凡是慢半拍”的觀感。
在離職員工打造的AI獨(dú)角獸成長為了科技圈新貴,微軟后來居上全面在軟件服務(wù)擁抱AI的時(shí)候,谷歌的高層似乎還陷在應(yīng)對監(jiān)管機(jī)構(gòu)頻頻開展的反壟斷調(diào)查,顧慮AI應(yīng)用帶來科技倫理問題,因而遲遲不敢行動的泥潭里。
在AI底層架構(gòu)來看,谷歌AI仍是王者一般的存在。
當(dāng)下最火爆的生成式Ai應(yīng)用背后都離不開Transformer框架,而這一框架是谷歌的研究人員在2017年發(fā)布的。Transformer迅速成為自然語言處理領(lǐng)域的標(biāo)準(zhǔn)模型,幫助OpenAI解決了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)長距離依賴問題,這才有了ChatGPT性能的飛躍式提升。
在AI基礎(chǔ)設(shè)施領(lǐng)域,和其他科技巨頭一樣,谷歌也在走自研路線,并不想被英偉達(dá)拿捏了。谷歌推出了轉(zhuǎn)為機(jī)器學(xué)習(xí)和深度學(xué)期打造的張量處理器(TPU)。TPU在語音識別、圖像處理等方面取得了顯著表現(xiàn),對英偉達(dá)的GPU發(fā)起直接挑戰(zhàn)。按照官方的數(shù)據(jù),TPU v5p在速度上不輸甚至可能優(yōu)于英偉達(dá)的H100。
此外,谷歌的BERT和EfficientNet等成果也在自然語言處理和計(jì)算機(jī)視覺領(lǐng)域產(chǎn)生了重要影響。
2018年起,谷歌在AI領(lǐng)域展現(xiàn)出來的姿態(tài)是拼命卷自己、繼續(xù)抓住在行業(yè)內(nèi)的話語權(quán),但在面向普通用戶的消費(fèi)端應(yīng)用上保持低調(diào),卻更多是后臺行動。
這可能與谷歌的搜索引擎的商業(yè)模式,以及其被反壟斷監(jiān)管機(jī)構(gòu)盯上有關(guān)。谷歌的搜索引擎長期以來是行業(yè)霸主,全球市占率超過90%。如果谷歌大張旗鼓地推廣AI機(jī)器人,并率先將其引入到搜索引擎對話框中,勢必會引來新一波反壟斷調(diào)查,還會直接影響谷歌的根基廣告收入。
但在搜索引擎市場市占份額很小的微軟,則不需要考慮商業(yè)收入,也不需要忌憚反壟斷監(jiān)管,重注 Open AI,在ChatGPT推出,馬上在Bing引入GPT。畢竟,微軟作為進(jìn)攻方,只要能從谷歌手里切下更多的份額就是勝利。
所以,谷歌不是輸在技術(shù)維度。事實(shí)上,無論從哪方面看,深厚的技術(shù)儲備、廣泛的應(yīng)用場景、領(lǐng)先的技術(shù)前瞻、豐富的數(shù)據(jù)資源和擴(kuò)展中的生態(tài)系統(tǒng)都證明谷歌在 AI 領(lǐng)域有著巨大的潛力。
但OpenAI的火爆程度和微弱咄咄逼人的布局速度可能超過了谷歌的預(yù)期。一旦競爭對手在消費(fèi)者心中建立起了固定印象,扭轉(zhuǎn)市場競爭形勢的難度會幾何倍數(shù)增長,谷歌因種種顧慮而選擇的穩(wěn)妥保守的策略就不得不變了。
所以,最近一段時(shí)間,谷歌裁員、重組,聚焦 AI,接連發(fā)布了Gemini和Gemma,試圖重奪AI行業(yè)領(lǐng)頭羊,也是皮查伊向董事會、資本市場證明其能力的放手一搏。
只是“Gemini歧視白人”的網(wǎng)絡(luò)輿情爆發(fā)卻完全抹去了皮查伊的努力,所以才爆出其可能被辭職的消息。在皮查伊的領(lǐng)導(dǎo)下,谷歌出于政治正確過于強(qiáng)調(diào)多元化,人為干預(yù)、調(diào)整模型參數(shù),現(xiàn)在反而被輿論所反噬。
這位非技術(shù)出身的 CEO,越來越多的被拿來與其印度“老鄉(xiāng)”微軟CEO薩提亞·納德拉(Satya Nadella)做比較。納德拉擔(dān)任微軟 CEO 后,聚焦云服務(wù),改變微軟的商業(yè)模式,重注Open AI,將微軟從“互聯(lián)網(wǎng)時(shí)代的活化石”變成了云服務(wù)、AI 的迎領(lǐng)者,微軟的市值也從約3,000億美元增長到超過3萬億美元。
而此前市值與微軟難分伯仲的谷歌,如今市值只有1.7萬億美元。同為印度裔,同為超級科技公司 CEO,相比納德拉,皮查伊更顯得乏善可陳。
面對崩壞的口碑、平淡的股價(jià),留給皮查伊的時(shí)間,可能確實(shí)不多了。