文|侃科技
今年3月,面對(duì)洶涌而來的AI潮,“硅谷刀王”一改往日本色,主動(dòng)站到臺(tái)前,宣布推出DGX云,把AI專用的GPU放到云上「出租」。
以往,出售算力這種事都是云計(jì)算公司在干。它們購買多種型號(hào)顯卡與人工智能加速器,根據(jù)硬件性能或使用時(shí)長(zhǎng)等方式定價(jià),然后租給下游客戶。
這個(gè)過程中,英偉達(dá)將GPU要么賣給云計(jì)算平臺(tái),要么直接出售給AI公司,比如第一臺(tái)NVIDIA DGX超級(jí)計(jì)算機(jī)就是2016年老黃親自交付給OpenAI的,并沒有直接出售算力,頂多算「賣鏟人」。
而DGX上云這個(gè)事,雖然英偉達(dá)仍需要將其托管到云平臺(tái),但本質(zhì)上已經(jīng)是跨越邊界了。
一向屈居幕后的英偉達(dá),這次為何要走向臺(tái)前?
本輪AI潮英偉達(dá)毫無疑問是最大的受益者,甚至可以沒有之一。
用于訓(xùn)練AI的GPU芯片價(jià)格瘋長(zhǎng),海外A100和H100的每片價(jià)格分別漲到了1.5萬美元和4萬美元,國(guó)內(nèi)一臺(tái)配置8顆A100和80G存儲(chǔ)空間的AI服務(wù)器,價(jià)格也從去年中旬的8萬/臺(tái)飆升至當(dāng)前的165萬/臺(tái)。
但這些錢并沒有都流入英偉達(dá)的口袋,溢價(jià)都被渠道拿走了,關(guān)鍵是這種倒買倒賣英偉達(dá)還一點(diǎn)辦法沒有。
DGX云就在這種情況下應(yīng)運(yùn)而生,關(guān)鍵價(jià)格看似還很便宜。配備8個(gè)H100 GPU模組的DGX云,每月套餐費(fèi)只要3.7萬美元,相當(dāng)于單片H100的價(jià)格。
對(duì)于急需算力資金又捉襟見肘的AI公司來說,DGX云無疑是渴睡時(shí)天降的一個(gè)枕頭;對(duì)英偉達(dá)而言,出售云算力既能賺錢又綁定了客戶。
而看似雙贏的背后,卻隱藏著一場(chǎng)始于AI的秘密戰(zhàn)爭(zhēng)。
算力平權(quán)
從產(chǎn)業(yè)特點(diǎn)看,今天基于云算力的AIGC和曾經(jīng)的加密資產(chǎn)挖礦極其相似,但需要的資源遠(yuǎn)高于后者。
國(guó)盛證券曾在《Web3 視角下的AIGC算力進(jìn)化論》中,比較了加密資產(chǎn)挖礦和AIGC產(chǎn)業(yè)的異同點(diǎn):
1、AIGC產(chǎn)業(yè)耗電量大約會(huì)在1.6-7.5年間超過當(dāng)前比特幣挖礦產(chǎn)業(yè)耗電量,主要驅(qū)動(dòng)因素是GPT類大語言模型在模型參數(shù)、日活和模型數(shù)量上的高速增長(zhǎng);
2、和比特幣挖礦類似,AIGC產(chǎn)業(yè)由算力驅(qū)動(dòng)的內(nèi)容處于高強(qiáng)度競(jìng)爭(zhēng)中,參與者只有持續(xù)、快速生產(chǎn)出高質(zhì)量?jī)?nèi)容,才能保證自己獲取到的用戶注意力不會(huì)下降。
這就導(dǎo)致AIGC產(chǎn)業(yè)的兩大特點(diǎn):高成本和持續(xù)性。
其中,成本側(cè)不止是耗電量,當(dāng)然耗電量可以作為一個(gè)非常直觀的證據(jù)。比如百度用于訓(xùn)練推理文心一言的陽泉超算中心,每小時(shí)耗電64000kW·h(度),按照0.45元/kW·h的商業(yè)用電標(biāo)準(zhǔn),一年電費(fèi)就達(dá)到2.5億。
而更大的成本則是來自算力投入。
以ChatGPT為例,不考慮與日活高度相關(guān)推理過程所需的算力,僅考慮訓(xùn)練過程,根據(jù)測(cè)算,1750億參數(shù)的GPT-3訓(xùn)練一次大約需要6000張英偉達(dá)A100顯卡,如果考慮互聯(lián)損失,大約需要上萬張A100。
按單張A100芯片10萬計(jì)算,大規(guī)模訓(xùn)練就需要投入約10億,一般廠商根本承擔(dān)不起。而GPT-4的模型參數(shù)更大,訓(xùn)練的標(biāo)識(shí)符更多,所需算力更為可觀。
并且,隨著更多AIGC大模型的發(fā)布,其所需算力直線狂飆。
根據(jù)OpenAI測(cè)算,自2012年至2018年,用于訓(xùn)練AI所需要的算力大約每隔3-4個(gè)月翻倍,總共增長(zhǎng)了30萬倍(而摩爾定律在相同時(shí)間只有7倍的增長(zhǎng)), 每年頭部訓(xùn)練模型所需算力增長(zhǎng)幅度高達(dá)10倍,整體呈現(xiàn)指數(shù)級(jí)上漲。
這個(gè)時(shí)候就體現(xiàn)出云算力的優(yōu)勢(shì)了,總結(jié)下來可以歸結(jié)為8個(gè)字:化整為零,按需付費(fèi)。
云算力能讓AIGC大模型廠商無需購買英偉達(dá)A100顯卡等硬件,而直接按需租用云算力平臺(tái)提供的算力,這使得初創(chuàng)企業(yè)或非頭部模型廠商也能嘗試進(jìn)入AIGC領(lǐng)域。
甚至這種“化整為零”的方式,對(duì)產(chǎn)業(yè)鏈各方都有益處:
1)對(duì)上游算力生產(chǎn)商而言,在算力硬件進(jìn)入淡季、庫存趨增時(shí),能通過售賣云算力的方式,平滑收入的波動(dòng),并為旺季儲(chǔ)備“有生”力量,及時(shí)滿足回彈的市場(chǎng)需求;
2)對(duì)中游云服務(wù)廠商而言,則有助于增加客流;
3) 對(duì)下游算力需求方而言,能最大化降低使用算力的門檻,驅(qū)動(dòng)全民AIGC 時(shí)代降臨。
如果AIGC大模型廠商愿意讓渡更多資源,還可以更深入地與云平臺(tái)合作。這方面的典型案例是微軟云與OpenAI的合作,兩者的合作沒有停留在算力租用上,而深入到了股權(quán)與產(chǎn)品的融合。
另外,在大模型競(jìng)賽中,除了顯性的硬件投入成本,還有一個(gè)隱形的時(shí)間成本。
一般而言,大模型對(duì)于算力的需求分為兩個(gè)階段,一是訓(xùn)練出類ChatGPT大模型的過程;二是將這個(gè)模型商業(yè)化的推理過程。
而且這個(gè)過程越持續(xù)大模型就越好。所以現(xiàn)在再來看英偉達(dá)DGX云,就不難搞懂老黃干了一件什么事。
用云的方式把用于AI訓(xùn)練的GPU價(jià)格打下來,算力平權(quán)籠絡(luò)中小公司,再基于大模型訓(xùn)練的持續(xù)性因素綁定客戶,“硅谷刀王”一舉兩得。
受益的未必是英偉達(dá)
從去年12月開始,英偉達(dá)A100的價(jià)格5個(gè)月累計(jì)漲幅達(dá)到37.5%,同期A800價(jià)格累計(jì)漲幅也達(dá)到了20.0%。
GPU價(jià)格暴漲無疑增加了AIGC訓(xùn)練大模型的門檻,但對(duì)于頭部廠商而言,漲多少價(jià)GPU都是要買的。但對(duì)于腰部公司來說,不漲價(jià)可能咬咬牙還能下單,一漲價(jià)就只能望GPU興嘆了,王慧文創(chuàng)業(yè)拿到的5000萬美金融資,可能連訓(xùn)練所需的顯卡都買不全。
所以,老黃在這個(gè)時(shí)候拿出DGX云,就像開了一家豪車租賃公司,讓買不起的人也能租用。
當(dāng)然,這背后英偉達(dá)的另一層考量,即搶在競(jìng)爭(zhēng)對(duì)手前面,綁定更多的中小客戶。
本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是一款A(yù)I繪圖應(yīng)用,最近同QQ頻道合作開啟了國(guó)內(nèi)業(yè)務(wù),后者的創(chuàng)始人則是出自O(shè)penAI,其對(duì)話機(jī)器人Claude直接對(duì)標(biāo)ChatGPT。
這兩家公司有一個(gè)相同點(diǎn),就是都沒有購買英偉達(dá)GPU搭建超算,而是使用Google的算力服務(wù)。
該服務(wù)由一個(gè)集成4096塊TPU v4的超算系統(tǒng)提供,重點(diǎn)是Google自研。
另外一家搞自研芯片的巨頭是本輪AI浪潮的引領(lǐng)者微軟,傳聞這款名叫Athena的芯片采用5nm先進(jìn)制程,由臺(tái)積電代工,研發(fā)團(tuán)隊(duì)人數(shù)已經(jīng)接近300人。
很明顯,這款芯片目標(biāo)就是替代昂貴的A100/H100,給OpenAI提供算力引擎,并最終一定會(huì)通過微軟的Azure云服務(wù)來搶奪英偉達(dá)的蛋糕。
除了云計(jì)算公司的背刺,英偉達(dá)的大客戶特斯拉也要自己?jiǎn)胃伞?/p>
2021年8月,馬斯克就向外界展示了用3000塊自家D1芯片搭建的超算Dojo ExaPOD。其中D1芯片由臺(tái)積電代工,采用7nm工藝,3000塊D1芯片直接讓Dojo成為全球第五大算力規(guī)模的計(jì)算機(jī)。
相較之下,國(guó)產(chǎn)芯片可以做對(duì)信息顆粒度要求沒有那么高的云端推理工作,但大多目前無法處理超高算力需求的云端訓(xùn)練。
燧原科技、壁仞科技、天數(shù)智芯、寒武紀(jì)等公司都推出了自己的云端產(chǎn)品,且理論性能指標(biāo)不弱。
據(jù)此前曝光的信息,百度用于訓(xùn)練推理文心一言的陽泉超算中心,除了A100還用了一些國(guó)產(chǎn)化的產(chǎn)品,比如百度自研的昆侖芯和寒武紀(jì)的思元590,其中有消息顯示2023年采購計(jì)劃思元大概占10%-20%。
其中,文心一言的芯片層核心能力來自昆侖芯2代AI芯片,其采用自研XPU-R架構(gòu)、7nm工藝和GDDR6高速顯存,通用性和性能顯著提升;具有256 TOPS@INT8和128 TFLOPS@FP16的算力水平,較一代提升2-3倍。
今年3月,李彥宏也在亞布力中國(guó)企業(yè)家論壇上分享,昆侖芯片現(xiàn)在很適合做大模型的推理,將來會(huì)適合做訓(xùn)練。
尾聲
從RIVA128開始,英偉達(dá)就展示了自己驚人的市場(chǎng)觀察能力。過去的十幾年里,從加密貨幣挖礦到元宇宙,再到AI潮,英偉達(dá)順勢(shì)將顯卡的客戶從游戲玩家拓展到了科技巨頭。
伴隨著戰(zhàn)火蔓延,英偉達(dá)市值也一路高歌,從一個(gè)二線芯片公司變成了全行業(yè)的No.1。只是,黃仁勛說AI的iPhone時(shí)刻已到來,那么諾基亞都被蘋果打敗,英偉達(dá)又怎能是無敵的呢。
參考資料
[1] AIGC的看多期權(quán):AI云算力,國(guó)盛證券
[2] Web3 視角下的AIGC 算力進(jìn)化論,國(guó)盛證券
[3] 英偉達(dá)帝國(guó)的一道裂縫,遠(yuǎn)川研究所
[4] 云算力挖礦可能是現(xiàn)在入場(chǎng)比特幣最穩(wěn)的路,Odaily星球日?qǐng)?bào)
[5] 百度“文心一言”專家解讀,獨(dú)角獸智庫
[6] 大模型時(shí)代,國(guó)產(chǎn)GPU加速「狂飆」,數(shù)字時(shí)氪
[7] 英偉達(dá)黃仁勛:將通過中國(guó)云服務(wù)商提供AI超算能力,AI的iPhone時(shí)刻到來! 第一財(cái)經(jīng)
[8] AI算力產(chǎn)業(yè)鏈?zhǔn)崂恚杭夹g(shù)迭代推動(dòng)瓶頸突破,AIgc場(chǎng)景增多驅(qū)動(dòng)算力需求提升,安信證券