文|融中財(cái)經(jīng)
ChatGPT一夜爆火,掀起了產(chǎn)業(yè)界對(duì)于AI大模型的追逐,也吹響了“百模大戰(zhàn)”的號(hào)角。為了與OpenAI的ChatGPT抗衡,各方紛紛下注。電商巨頭亞馬遜近期也開(kāi)始在AI領(lǐng)域頻頻發(fā)力,并向 OpenAI的頭號(hào)對(duì)手Anthropic豪擲了40億美元(約合292.34億元人民幣)。而這項(xiàng)投資被認(rèn)為是迄今為止亞馬遜在生成式AI領(lǐng)域中最大的一項(xiàng)投資。
不過(guò)就在亞馬遜宣布上述投資幾天后,Anthropic再次傳出了融資動(dòng)向。10月4日,有消息稱(chēng)Anthropic嘗試找谷歌以及其他投資人談判,計(jì)劃再募集20億美元(約合146.17億元人民幣)的新資金,投后估值或預(yù)計(jì)達(dá)200-300億美元之間。該公司的新估值將是今年3月40億美元的5倍以上。讓這家成立不到兩年的AI初創(chuàng)公司風(fēng)頭一時(shí)無(wú)兩。
01 Anthropic什么來(lái)頭
受到谷歌、亞馬遜青睞的Anthropic究竟有何背景?先來(lái)參考一下中文通用大模型綜合性評(píng)測(cè)基準(zhǔn)SuperCLUE發(fā)布的9月榜單。測(cè)試結(jié)果顯示,Anthropic推出的Claude 2總分僅次于OpenAI的GPT-4和GPT-3.5,位列第三。
9月SuperCLUE總排行榜上Claude 2位列第三(圖片來(lái)自于cluebenchmarks.com)
除了在社區(qū)榜單上的優(yōu)勢(shì)排名外,Anthropic的創(chuàng)始團(tuán)隊(duì)也不一般。創(chuàng)始人Dario Amodei和Daniela Amodei兄妹倆,在創(chuàng)業(yè)前均來(lái)自O(shè)penAI,并在其中擔(dān)任重要職位:Dario是研究副總裁,Daniela是安全政策副總裁。其中,Dario早在OpenAI創(chuàng)立之初便加入了,堪稱(chēng)其元老級(jí)人物之一。另外幾位如Jared Kaplan、Sam McCandlish、Tom Brown等核心研究員也都來(lái)自O(shè)penAI,并且均參與過(guò)GPT-2與GPT-3 的開(kāi)發(fā)。這些GPT系列產(chǎn)品的早期開(kāi)發(fā)者在2021年成立了Anthropic。
隨著ChatGPT的發(fā)布,Anthropic也不甘示弱,僅用兩個(gè)月時(shí)間便推出了可與之對(duì)標(biāo)的類(lèi)ChatGPT產(chǎn)品——Claude,又在7月初完成了Claude 2的升級(jí),速度驚人。有業(yè)內(nèi)測(cè)評(píng)顯示,在綜合性能上,Claude 2與GPT-3.5相當(dāng),但與GPT-4仍存在差距。在文件上傳、長(zhǎng)文本處理上,Claude 2優(yōu)勢(shì)明顯,可將上下文處理的token數(shù)量擴(kuò)展到10萬(wàn)個(gè),相當(dāng)于7.5萬(wàn)個(gè)英文單詞。Claude是GPT-4容納token量的3倍,Claude 2更可處理數(shù)百頁(yè)技術(shù)文檔,甚至是一本書(shū)。在邏輯與計(jì)算上,Claude 2與GPT-4性能已不相上下,但代碼生成和問(wèn)題推理方面較弱。憑借著文本處理數(shù)量上的巨大優(yōu)勢(shì),Claude可與現(xiàn)階段商用的大模型進(jìn)行差異化競(jìng)爭(zhēng)。
Anthropic在技術(shù)圈認(rèn)可度也很高,被認(rèn)為是OpenAI的強(qiáng)勁對(duì)手,其致力于解決大語(yǔ)言模型現(xiàn)有的難點(diǎn),并在AI安全技術(shù)、大模型的潛在危害性、大模型的可解釋性等方面進(jìn)行了大量研究。對(duì)此,Anthropic提出了憲法式AI方法,為AI系統(tǒng)設(shè)定憲法原則,以區(qū)別于人類(lèi)反饋強(qiáng)化學(xué)習(xí)RLHF方法,利于實(shí)現(xiàn)更精確、更自動(dòng)化的AI行為監(jiān)督和控制。憲法式AI方法將避免未來(lái)AI過(guò)于智能,危及人類(lèi)的情況,為人類(lèi)監(jiān)督和管理AI提供了方案。
基于上述在AI合規(guī)領(lǐng)域的獨(dú)特優(yōu)勢(shì),Anthropic將AI安全技術(shù)視作其產(chǎn)品和解決方案的核心賣(mài)點(diǎn)之一。而這一商業(yè)定位與OpenAI等競(jìng)爭(zhēng)對(duì)手有著顯著區(qū)別,有可能在AI安全市場(chǎng)上搶到先機(jī)。
大模型是個(gè)吞金獸。為了持續(xù)迭代升級(jí),Anthropic希望未來(lái)兩年能夠再籌集50億美元以訓(xùn)練更為復(fù)雜的模型,而此次亞馬遜提供的40億美元?jiǎng)t將用于訓(xùn)練Claude-Next——Anthropic的新一代大模型。新的大模型生成能力預(yù)計(jì)是當(dāng)前最強(qiáng)AI的10倍。在應(yīng)用上,Claude-Next將以行業(yè)落地為主,目標(biāo)是切入到十幾個(gè)主要行業(yè)里。
此前Anthropic的年?duì)I收大約為1億美元,隨著與亞馬遜的合作展開(kāi)與深入,預(yù)計(jì)2023年的全年?duì)I收有望翻倍,增長(zhǎng)至2億美元,月?tīng)I(yíng)收約至1700萬(wàn)美元。到2024年底,Anthropic年?duì)I收將有望達(dá)到5億美元,是其估值的1/200倍,遠(yuǎn)遠(yuǎn)超出OpenAI的營(yíng)收能力。
縱觀業(yè)內(nèi),Anthropic已成為當(dāng)前硅谷最受資本歡迎的AI公司之一,整體估值接近50億美元,僅次于OpenAI,位列第二。
02 科技巨頭間的AI角力
AI大模型生成能力的每一次躍遷,對(duì)于算力的需求來(lái)說(shuō),都會(huì)呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。這勢(shì)必引發(fā)對(duì)底層算力基礎(chǔ)設(shè)施以及大量資金的追逐,也注定了這是一場(chǎng)科技巨頭之間的慘烈大戰(zhàn)。在這波AI浪潮下,美國(guó)科技巨頭各逞其能,早已從單純比拼大模型產(chǎn)品,延展至大模型結(jié)合算力的核心基礎(chǔ)能力較量。對(duì)于亞馬遜、微軟、谷歌作為全球云服務(wù)的三大巨頭而言,則是對(duì)云端計(jì)算與服務(wù)的實(shí)力新考驗(yàn)。另外,以特斯拉為代表的產(chǎn)業(yè)新勢(shì)力,同樣躍躍欲試,正在快速殺入戰(zhàn)局。此時(shí)的競(jìng)爭(zhēng)焦點(diǎn)逐步變?yōu)閾屓耍ㄩ_(kāi)發(fā)者和使用者)、搶資本和搶生態(tài)上。
從AI大模型迭代,到算力消耗,再到資本投入,吸引更多的開(kāi)發(fā)者和使用者,形成AI云服務(wù)生態(tài),最終收獲商業(yè)回報(bào)。這是科技巨頭們期待看到的良性循環(huán)?;ヂ?lián)網(wǎng)時(shí)代,亞馬遜在云服務(wù)領(lǐng)域處于領(lǐng)先地位,但在AI時(shí)代,由于在AI大模型和算力方面的滯后,其云服務(wù)市場(chǎng)份額面臨著微軟、谷歌的蠶食。微軟與OpenAI、谷歌與DeepMind的結(jié)合,使微軟云Azure、谷歌云GCP相比亞馬遜AWS,不只有了AI附加值,還有固定的業(yè)務(wù)出口,具備明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。這也成為亞馬遜砸錢(qián)Anthropic的重要原因。
微軟:2019年投資了OpenAI,2023年初加碼投資100億美元,對(duì)OpenAI持股比重49%,藉由ChatGPT熱潮,微軟完成了從最初的軟件提供商到云服務(wù)商再到AI領(lǐng)導(dǎo)者的角色轉(zhuǎn)換。同時(shí),微軟也試圖將投資OpenAI的成功復(fù)制到其他AI初創(chuàng)企業(yè),遂又戰(zhàn)略性投了Inflection AI、人工智能獨(dú)角獸Adep。同時(shí)與開(kāi)源AI大模型Meta/Facebook LlaMA 2合作,在開(kāi)源與閉源AI大模型兩邊下注,以提升微軟云Azure競(jìng)爭(zhēng)力。
谷歌:盡管有DeepMind與谷歌大腦合并,但仍然不影響谷歌對(duì)Anthropic持續(xù)下注。OpenAI的強(qiáng)勢(shì)崛起,令谷歌“鴨梨山大”,今年2月便投了Anthropic 4億美元,獲得其10%股份;10月初,傳Anthropic與谷歌等投資方溝通,準(zhǔn)備新一輪至少20億美元融資。另外,谷歌繼推出LLM聊天機(jī)器人Bard后,又宣布推出新版AI模型Gemini,曾被認(rèn)為是當(dāng)前GPT-4最強(qiáng)勁的挑戰(zhàn)者,但具體表現(xiàn)仍有待驗(yàn)證。
亞馬遜:屬于AI后發(fā)跟進(jìn)者,5年前錯(cuò)失了與OpenAI的合作機(jī)會(huì),讓微軟成為這輪AI時(shí)代“嘗鮮人”;在對(duì)Anthropic投資中,又比谷歌晚了半年左右時(shí)間,今年9月下旬才向Anthropic初步投資12.5億美元,之后最多可增投至40億美元。目前,亞馬遜持有Anthropic少數(shù)股權(quán),Anthropic估值尚未確定。如果亞馬遜這筆投資順利完成,將是其在AI相關(guān)領(lǐng)域里的最大一筆投資。
Meta:同樣是AI后發(fā)者。Meta從最初的投入元宇宙,轉(zhuǎn)而布局AI,宣布推出大型語(yǔ)言模型LLM的第一個(gè)版本LLaMA。為扭轉(zhuǎn)后發(fā)局勢(shì),Meta拋出了“開(kāi)源免費(fèi)”的大招。與微軟、谷歌先通過(guò)大模型優(yōu)化現(xiàn)有產(chǎn)品(例如,微軟將OpenAI接入BING、Office和Azure,谷歌將AI技術(shù)應(yīng)用在搜索、Workspace、地圖等)不同,Meta期待通過(guò)AI構(gòu)建出更具前瞻性的元宇宙,野心不容小覷。
特斯拉/xAI:馬斯克曾是OpenAI創(chuàng)辦人之一,但現(xiàn)在已退出并成立了新的AI公司xAI,目標(biāo)是了解宇宙真正的本質(zhì),試圖要打造一個(gè)“好的通用型人工智能(AGI)”。2023年8月28日,已上線1萬(wàn)塊英偉達(dá)H100 GPU組成的超級(jí)計(jì)算機(jī)集群,將用于訓(xùn)練特斯拉自動(dòng)駕駛系統(tǒng)FSD與其他各種AI應(yīng)用。另外,特斯拉Dojo超級(jí)計(jì)算機(jī)將于2023年7月正式開(kāi)始量產(chǎn),進(jìn)一步強(qiáng)化算力基礎(chǔ)設(shè)施。特斯拉自研芯片D1作為Dojo核心,基于臺(tái)積電7nm制程與先進(jìn)封裝技術(shù)打造,2023年特斯拉在臺(tái)積電投片量約5000片12寸晶圓,預(yù)計(jì)2024年將翻倍至1萬(wàn)片;未來(lái),特斯拉有可能像亞馬遜AWS云服務(wù)一樣,將Dojo對(duì)外開(kāi)放。
蘋(píng)果:憑借著龐大的Siri群體,似乎對(duì)此次ChatGPT風(fēng)潮較為不屑,在公開(kāi)發(fā)言場(chǎng)合也比較不愛(ài)用“AI”一詞,而是較常用機(jī)器學(xué)習(xí)(Machine Learning)。整體來(lái)看,蘋(píng)果的AI技術(shù)傾向用來(lái)優(yōu)化現(xiàn)有產(chǎn)品的基本功能。不過(guò),庫(kù)克近日也表示:“AI 在我們產(chǎn)品中幾乎無(wú)處不在,公司正在進(jìn)行的生成式 AI 研究,我們有很多工作要做。”
03 亞馬遜的必然選擇
具體再來(lái)看看亞馬遜,其業(yè)務(wù)重點(diǎn)原本來(lái)自AWS的云計(jì)算業(yè)務(wù),今年第二季度的收入增長(zhǎng)了12.16%,達(dá)到了221.4億美元,但利潤(rùn)卻下降了6.12%,為53.65億美元,經(jīng)營(yíng)利潤(rùn)率也下降了4.72個(gè)百分點(diǎn),至24.23%。盡管AWS的收入貢獻(xiàn)不算太高,但利潤(rùn)貢獻(xiàn)仍占到整體的大頭。顯然,亞馬遜憑借著全球知名云計(jì)算服務(wù)供應(yīng)商的身份,其云計(jì)算貢獻(xiàn)的利潤(rùn)勉強(qiáng)彌補(bǔ)了其零售業(yè)務(wù)的微薄利潤(rùn)甚至虧損情況。
不過(guò),隨著OpenAI與微軟的深度捆綁,帶動(dòng)了微軟云計(jì)算業(yè)務(wù)Azure的市場(chǎng)占有率,對(duì)亞馬遜形成了極大地威脅。在近期亞馬遜業(yè)績(jī)發(fā)布會(huì)上,CEO Andy Jassy強(qiáng)調(diào)云計(jì)算業(yè)務(wù)在近幾個(gè)季度的利潤(rùn)率大幅下滑,其規(guī)模效益似乎正逐漸減弱。但AWS仍是無(wú)可置疑的云基建領(lǐng)導(dǎo)者,且在客戶(hù)數(shù)量、合作伙伴生態(tài)規(guī)模以及功能廣度方面均處于領(lǐng)先位置,同時(shí)實(shí)現(xiàn)了最為強(qiáng)勁的經(jīng)營(yíng)表現(xiàn)。人們已經(jīng)對(duì)生成式AI產(chǎn)生了極大的興趣,但大多數(shù)人討論最多的是應(yīng)用層,特別是OpenAI通過(guò)ChatGPT所做的事情。而亞馬遜在底層基座上的能力優(yōu)勢(shì),顯然可以成為新的發(fā)力點(diǎn)。
一般來(lái)說(shuō),對(duì)于希望應(yīng)用大模型的企業(yè),自研大模型需要數(shù)十億美元以及多年的訓(xùn)練,這就需要大量資金和設(shè)備的支持才行。更為實(shí)惠的解決方案是,對(duì)一些已經(jīng)非常強(qiáng)大的開(kāi)源基礎(chǔ)模型進(jìn)行定制化的微調(diào),以滿(mǎn)足自身的多樣化業(yè)務(wù)需求。據(jù)預(yù)測(cè),到2026年,僅在企業(yè)技術(shù)方面,這種希望與AI結(jié)合的市場(chǎng)規(guī)模就將從2023年的近430億美元上升到980億美元(約合7168.5億元人民幣),市場(chǎng)空間巨大。
對(duì)此,今年4月亞馬遜AWS發(fā)布了全托管基礎(chǔ)模型服務(wù)“Amazon Bedrock”,以“關(guān)鍵基礎(chǔ)設(shè)施提供商”的角色加入了大模型之戰(zhàn),希望從與微軟云、谷歌云手中搶回更多市場(chǎng)份額。另外,亞馬遜投資Anthropic的更深層次戰(zhàn)略目標(biāo),包括Anthropic承諾使用AWS自研的AI專(zhuān)用芯片Trainium和AI加速器芯片Inferentia來(lái)構(gòu)建平臺(tái),訓(xùn)練和部署未來(lái)的AI基礎(chǔ)模型。事實(shí)上,AWS和Anthropic均表示,他們將在未來(lái)的Trainium和Inferentia技術(shù)上進(jìn)行合作。
Anthropic還做出了長(zhǎng)期承諾,計(jì)劃通過(guò)Bedrock為AWS客戶(hù)提供其未來(lái)幾代AI基礎(chǔ)模型的訪問(wèn)權(quán)限。相比于其他的一站式的大模型服務(wù)平臺(tái),Amazon Bedrock的優(yōu)勢(shì)在于,用戶(hù)可將其與亞馬遜AWS平臺(tái)的其余部分集成在一起,更輕松地訪問(wèn)存儲(chǔ)在Amazon S3對(duì)象存儲(chǔ)服務(wù)中的數(shù)據(jù),并能夠從亞馬遜AWS訪問(wèn)控制和治理策略中受益。而Amazon Bedrock的重要價(jià)值就在于此。這項(xiàng)服務(wù)可以讓所有人都可以基于已有的大模型、專(zhuān)用的AI算力和工具,再結(jié)合自己的數(shù)據(jù)開(kāi)始構(gòu)建生成式AI應(yīng)用。
可以說(shuō),生成式AI改變了云計(jì)算服務(wù)的競(jìng)爭(zhēng)格局,使得模型、框架和應(yīng)用層面的能力提供變得更加重要,同時(shí)也促進(jìn)了“模型即服務(wù)”新商業(yè)模式的出現(xiàn)。如Amazon Bedrock平臺(tái)就將大模型變成了一項(xiàng)可直接使用的服務(wù),利于推動(dòng)各行各業(yè)用戶(hù)方便地接入和應(yīng)用生成式AI。而商湯科技副總裁唐臻怡也曾向融中財(cái)經(jīng)表示,未來(lái)企業(yè)可能無(wú)需自研大模型和訓(xùn)練,基于通用大模型的基模型底座,再結(jié)合自身行業(yè)數(shù)據(jù),就能生出不同的參天大樹(shù)。
目前,我國(guó)的AI大模型也再加速發(fā)展,百度的“文心一言”、騰訊的“混元”、科大訊飛的“星火”……數(shù)據(jù)顯示,國(guó)內(nèi)已至少130家公司研究大模型產(chǎn)品,其中通用大模型有78家。
隨著大模型之戰(zhàn)愈演愈烈,對(duì)亞馬遜來(lái)說(shuō),投資Anthropic的錢(qián)已不可再省,甚至必須花出去,才能用來(lái)以小博大。而像谷歌、微軟、亞馬遜、英偉達(dá)這樣的大廠投資者來(lái)說(shuō),為當(dāng)紅的AI企業(yè)支付高溢價(jià),除了看重這些初創(chuàng)公司的技術(shù)前景和潛在市場(chǎng)外,如能順便拓展下自身業(yè)務(wù),增加云端服務(wù)器或自家芯片的使用,似乎就會(huì)達(dá)成一個(gè)雙贏的局面。