文|數(shù)智前線 徐鑫 趙艷秋
編輯|石兆
2024GTC大會(huì)上,當(dāng)外界對(duì)英偉達(dá)B200的性能驚嘆不已時(shí),黃仁勛也展現(xiàn)了他在通用AGI時(shí)代的完整戰(zhàn)略和布局。
在硬件層,新一代Blackwell架構(gòu)和B200芯片產(chǎn)品,順應(yīng)了AI計(jì)算洶涌浪潮下對(duì)更大規(guī)模、更高效計(jì)算能力的需求。黃仁勛判斷,GPU的形態(tài)發(fā)生變化,規(guī)模更為龐大的,用萬(wàn)億美元武裝的數(shù)據(jù)中心,將成為人工智能生成器。
在這些強(qiáng)大的數(shù)據(jù)中心中,新的算力將創(chuàng)造大量新的軟件。這些智能軟件,將呈現(xiàn)出新的分發(fā)模式,除了云端,也會(huì)打包成人們可攜帶的個(gè)人智能應(yīng)用。英偉達(dá)意在用NIM平臺(tái),支持應(yīng)用廠商開(kāi)發(fā)智能應(yīng)用,將NIM打造為CUDA生態(tài)之后的一個(gè)AI應(yīng)用級(jí)入口。
而由于智能可移動(dòng),未來(lái)所有移動(dòng)的東西都將是機(jī)器人,它們需要數(shù)字孿生系統(tǒng)Omniverse,作為機(jī)器人世界的操作系統(tǒng)。英偉達(dá)的人形機(jī)器人基礎(chǔ)模型Project GR00T和 數(shù)字孿生系統(tǒng)Ominicerse API基于這一布局。
業(yè)界觀察到,英偉達(dá)的Blackwell架構(gòu)GPU產(chǎn)品,將進(jìn)一步拉大與業(yè)界其他芯片企業(yè)在大模型訓(xùn)練上的差距,這種差距甚至可能在幾十倍水平。不過(guò)在大模型推理芯片上,已有不少企業(yè)搶奪了英偉達(dá)的市場(chǎng)份額。
綜合這些因素,資本市場(chǎng)對(duì)英偉達(dá)的未來(lái)走向也產(chǎn)生了分歧,這支當(dāng)下最受歡迎的股票,正在分裂華爾街。
01、大模型訓(xùn)練算力,英偉達(dá)一騎絕塵
這場(chǎng)大會(huì)在圣何塞鯊魚(yú)隊(duì)的主場(chǎng)舉行,現(xiàn)場(chǎng)氣氛熱烈,有媒體形容這場(chǎng)盛會(huì)更像是一個(gè)體育賽事或搖滾音樂(lè)會(huì)。
最受矚目的,當(dāng)然是黃仁勛發(fā)布了新的GPU架構(gòu)Blackwell,并釋出了該架構(gòu)下的最新人工智能芯片B200。
Blackwell架構(gòu)以數(shù)學(xué)家戴維·布萊克韋爾(David Blackwell)來(lái)命名。這是英偉達(dá)推出的第七代GPU。2012年5月英偉達(dá)發(fā)布開(kāi)普勒架構(gòu),推出了兩款k10和k20加速器,正式開(kāi)啟了GPU時(shí)代。
黃仁勛在演講中將Blackwell與上一代架構(gòu)Hopper做了對(duì)比,稱Blackwell是新工業(yè)革命的引擎。新架構(gòu)下的B200包含2080億個(gè)晶體管,比H100的800億個(gè)晶體管多2.5倍。B200可提供高達(dá)20千兆次的 AI 計(jì)算性能,是H100的5倍。
Blackwell架構(gòu)下GPU性能的提升,使得可支撐訓(xùn)練的生成式AI大模型參數(shù)量級(jí),擴(kuò)展10萬(wàn)億參數(shù)。
“我們需要更大的GPU?!秉S仁勛說(shuō)。過(guò)去8年時(shí)間里AI算力需求有了1000倍增長(zhǎng)。在Blackwell架構(gòu)下,芯片之間可連接構(gòu)建出大型AI超算集群,支撐更大的計(jì)算需求。
比如兩個(gè)B200 GPU與Grace CPU結(jié)合,通過(guò)900GB/s的NVLink互連技術(shù),構(gòu)成GB200超級(jí)芯片。兩個(gè)超級(jí)芯片形成一個(gè)計(jì)算節(jié)點(diǎn),18個(gè)計(jì)算節(jié)點(diǎn)構(gòu)成計(jì)算單元GB200 NVL72。它們可通過(guò)持續(xù)擴(kuò)展,最終構(gòu)成包含32000 GPU的分布式超算集群——英偉達(dá)DGX AI超級(jí)計(jì)算機(jī)。
黃仁勛在演講中提到,GPU的形態(tài)已徹底改變,未來(lái)“英偉達(dá)DGX AI超級(jí)計(jì)算機(jī),就是AI工業(yè)革命的工廠”。
英偉達(dá)還提供一組數(shù)據(jù)稱,由兩片B200組成的GB200,在基于1750億參數(shù)的GPT-3基準(zhǔn)測(cè)試中,性能大約是H100的七倍,而且英偉達(dá)稱它提供了4倍的訓(xùn)練速度。GB200將于今年晚些時(shí)候上市,英偉達(dá)尚未公布該超級(jí)芯片的售價(jià)。
業(yè)界觀察到,隨著發(fā)布新核彈,英偉達(dá)的GPU產(chǎn)品在AI訓(xùn)練上的性能和水平,與全球其他玩家的差距在進(jìn)一步拉大,甚至出現(xiàn)幾十倍的差距。
02、推理市場(chǎng),英偉達(dá)丟失不少份額
“雖然從大模型訓(xùn)練上,其他芯片廠商望塵莫及,但對(duì)于推理市場(chǎng),國(guó)內(nèi)外的芯片企業(yè),還是搶了不少英偉達(dá)的市場(chǎng)份額。”一位資深人士告訴數(shù)智前線,僅國(guó)內(nèi)就有十幾家相關(guān)企業(yè),更不用說(shuō)還有谷歌、亞馬遜等大企業(yè)。
推理追求的是“能效比”,比拼每瓦的計(jì)算性能。而今年大模型落地呈現(xiàn)一個(gè)爆發(fā)式增長(zhǎng),對(duì)推理的需求已經(jīng)很大了。
這也造成在兩周前,英偉達(dá)在CUDA11.6更新版本中,特意突出了一則警告:禁止其他硬件平臺(tái)上運(yùn)行基于CUDA的軟件。
“它打擊的就是AI加速芯片領(lǐng)域。英偉達(dá)想高低通吃,既要把持訓(xùn)練市場(chǎng),又要圍獵推理市場(chǎng)?!鄙鲜鲑Y深人士說(shuō)。
CUDA生態(tài),是英偉達(dá)花20年時(shí)間持續(xù)做的“基本功”。CUDA的價(jià)值,可以用Wintel聯(lián)盟為例,英特爾芯片每?jī)赡晟?jí)一代,而Windows系統(tǒng)的完善,實(shí)際上是讓業(yè)界將系統(tǒng)之上的應(yīng)用用起來(lái),比如辦公、互聯(lián)網(wǎng)。
英偉達(dá)一方面持續(xù)推出新GPU,另一方面,它的CUDA面向生命科學(xué)、量化、自動(dòng)駕駛等場(chǎng)景在開(kāi)發(fā)庫(kù),讓?xiě)?yīng)用企業(yè)不用從零開(kāi)始,直接去調(diào)用,很快就能完成一個(gè)藥物分子、自動(dòng)駕駛的應(yīng)用?!八膮柡χ幨牵赡蹸UDA上已經(jīng)寫(xiě)了10萬(wàn)行代碼,對(duì)于應(yīng)用企業(yè)來(lái)說(shuō),它再寫(xiě)幾百行、幾千行代碼,就解決問(wèn)題了?!?/p>
“我們?cè)瓉?lái)一直說(shuō)的一個(gè)詞叫云原生,現(xiàn)在正在發(fā)生的是AI原生,但對(duì)于業(yè)界來(lái)說(shuō),毫不夸張的說(shuō),一直都有一個(gè)CUDA原生。”資深人士感嘆,因?yàn)樵贑UDA上,很多應(yīng)用不需要從零開(kāi)始,它們可以快速切入一個(gè)領(lǐng)域或者一個(gè)行業(yè)。
這就是英偉達(dá)長(zhǎng)期的護(hù)城河。英偉達(dá)禁止其他硬件平臺(tái)上運(yùn)行CUDA,直接就造成兩個(gè)結(jié)果:一是在場(chǎng)景落地的時(shí)候,其他芯片廠商要付出的工作量會(huì)比較大;二是對(duì)于大多數(shù)芯片廠商來(lái)說(shuō),沒(méi)有了CUDA,變成了孤軍作戰(zhàn)。雖然它能滿足一個(gè)項(xiàng)目的需求,長(zhǎng)期發(fā)展變得更不容易。類似CUDA軟件層面的投入非常巨大,有業(yè)內(nèi)人士認(rèn)為,毛利率在50%以下的企業(yè)“想都別想”,而追上生態(tài),估計(jì)可能需要5~10年。
最近幾年,有報(bào)道在介紹國(guó)外追趕英偉達(dá)的芯片創(chuàng)業(yè)公司,目前從市場(chǎng)反饋看,都沒(méi)有真正做起來(lái)。
03、一年漲五倍,后續(xù)走向分裂華爾街
GTC大會(huì)召開(kāi)的預(yù)期下,昨晚英偉達(dá)的股價(jià)高開(kāi),盤(pán)中一度上漲超過(guò)4%,之后出現(xiàn)回落,收盤(pán)價(jià)僅上漲0.7%。不過(guò),到盤(pán)后股價(jià)略微下挫,跌1.7%。
過(guò)去一年多,自O(shè)penAI的ChatGPT在2022年末開(kāi)啟生成式人工智能的繁榮以來(lái),英偉達(dá)在資本市場(chǎng)一路狂飆,股價(jià)上漲五倍多。
2023年1月時(shí),英偉達(dá)股價(jià)最低點(diǎn)僅為142美元,到今年3月,股價(jià)最高點(diǎn)一度到達(dá)926美元。一時(shí)風(fēng)頭無(wú)兩。去年12月底,英偉達(dá)在經(jīng)紀(jì)公司分析師最喜歡的股票排行榜上,名列榜首。
隨著股價(jià)暴漲,到本月英偉達(dá)的市值最高超過(guò)2.2萬(wàn)億美元,成為了全球市值第三的公司,僅次于微軟和蘋(píng)果。
由于過(guò)去12個(gè)月英偉達(dá)股價(jià)一路飆升,一些人士判斷這只股票會(huì)遭遇調(diào)整期,這也使得一些分析師不再將英偉達(dá)列入買(mǎi)入評(píng)級(jí),在最受歡迎的股票榜上,英偉達(dá)甚至不再進(jìn)入前20名。
不過(guò)在GTC大會(huì)召開(kāi)前,一些分析師已經(jīng)上調(diào)了英偉達(dá)的目標(biāo)股價(jià)。例如,匯豐銀行(HSBC)分析師 Frank Lee 維持對(duì) Nvidia 股票的買(mǎi)入評(píng)級(jí),但將其目標(biāo)股價(jià)從此前的882美元上調(diào)至1,050美元。新的股價(jià)目標(biāo)比 Nvidia當(dāng)下的交易價(jià)高出18% 。
看好英偉達(dá)的人士堅(jiān)定認(rèn)為,市場(chǎng)對(duì)AI算力的強(qiáng)烈需求,當(dāng)下英偉達(dá)的不可取代性仍然非常明顯,仍將受益于洶涌的AGI浪潮。同時(shí)英偉達(dá)的新一代芯片產(chǎn)品的市場(chǎng)需求依然火爆,例如,英偉達(dá)CFO Colette Kress在今年2月的財(cái)報(bào)電話會(huì)議時(shí)預(yù)估,下一代產(chǎn)品的市場(chǎng)需求將超過(guò)供給,尤其是今年晚些時(shí)候發(fā)貨的新一代芯片B100依然供應(yīng)緊張。
而在給英偉達(dá)當(dāng)下的走向潑冷水的人里,最知名的當(dāng)屬人稱“木頭姐”的華爾街明星基金經(jīng)理、方舟投資管理公司的CEO凱茜·伍德(Cathie Wood)。她此前也大量持有英偉達(dá)股票,并斬獲頗豐。
今年2月她拋售了近450萬(wàn)美元的英偉達(dá)股票,并指出市場(chǎng)對(duì)英偉達(dá)的期待過(guò)高,并且隨著競(jìng)爭(zhēng)加劇和庫(kù)存的調(diào)整,英偉達(dá)未來(lái)業(yè)績(jī)有可能面臨挑戰(zhàn)。
更激進(jìn)的聲音則認(rèn)為英偉達(dá)存在泡沫。例如有投資界人士提到,投資者應(yīng)該仔細(xì)英偉達(dá)的這波AI需求驅(qū)動(dòng)的股價(jià)飆升與2000年前后思科估值之間的相似之處。
看好英偉達(dá)和不看好英偉達(dá)的觀點(diǎn)是如此針?shù)h相對(duì),以至于有人評(píng)價(jià)“英偉達(dá)正在分裂華爾街”。