文 | 表外表里 周霄 譚鳩云 謝昉辰
編輯 | 付曉玲 曹賓玲
“賣鏟子”是門好生意,但如果總賣給少數(shù)幾個(gè)挖礦人,時(shí)刻處于“關(guān)鍵客戶風(fēng)險(xiǎn)”暴露中,則未必。
正如英偉達(dá)明明已經(jīng)是AI芯片霸主,黃仁勛卻“每天早上醒來都擔(dān)心公司會倒閉”。
可以看到,英偉達(dá)的客戶一直非常集中,CR5常年占比過半。2002年巔峰時(shí)期,前五大客戶收入占比達(dá)到65%,前兩大客戶占比更是達(dá)到驚人的40%,當(dāng)時(shí)的大金主微軟撤單后,英偉達(dá)業(yè)績大跳水,股價(jià)雪崩90%。
類似的“大客戶危機(jī)”,在2008年蘋果、戴爾、惠普三大PC巨頭集體停單,以及后來谷歌、特斯拉等標(biāo)桿客戶自研芯片的時(shí)候,也再次上演。
時(shí)至今日(2024財(cái)年),英偉達(dá)前兩大客戶收入占比仍高達(dá)32%,前五大估計(jì)也接近50%,以致于華爾街分析師的保留項(xiàng)目之一,就是每次英偉達(dá)發(fā)完財(cái)報(bào)后,測算其大客戶集中度。
然而,超級金主們雖然掌握著英偉達(dá)的命門,但它們?nèi)缃褚巡桓以佥p易掀桌子了。
那些以撤單逼迫英偉達(dá)降價(jià)的巨頭,搖身一變成為英偉達(dá)的追隨者,黃老板每發(fā)一款新GPU,它們不惜成本地排隊(duì)加價(jià)搶購。
那么,從任人拿捏到反客為主,英偉達(dá)到底是如何反殺的?
本文復(fù)盤了其與大客戶們的3輪斗爭,發(fā)現(xiàn)英偉達(dá)的發(fā)家史,就是一部濃縮的技術(shù)和產(chǎn)業(yè)進(jìn)化史。從暫時(shí)領(lǐng)先到絕對領(lǐng)先、從可以替代到無可替代,它一步步奪回話語權(quán),直至成為新時(shí)代的“硅谷惡龍”。
一、充當(dāng)PC游戲“萬金油”,站在客戶的肩膀上
2002年對黃仁勛來說,一定是難忘的一年。
這一年,英偉達(dá)股價(jià)狂瀉90%,他的個(gè)人財(cái)富也縮水10倍,直接從“億萬富翁”跌回到了“千萬富翁”行列。
他的痛苦,來源于大金主微軟:兩家合作的Xbox游戲機(jī)項(xiàng)目到了要打價(jià)格戰(zhàn)的時(shí)刻,微軟要求英偉達(dá)降低GPU價(jià)格,但彼時(shí)英偉達(dá)也是踩著成本線造芯,自然拒絕砍價(jià),微軟一怒之下撕毀了雙方的合作。
要知道,微軟這一個(gè)合同占到了英偉達(dá)年銷售額近七成,合作破裂后,英偉達(dá)收入迅速收窄,市值也一落千丈。
飽嘗客大欺店的滋味,黃仁勛不得不妥協(xié),同意“降低Xbox的未來成本”。
然而,6年之后,面對蘋果、戴爾、惠普不滿GeForce 6000-9000系列芯片集體撤單,股價(jià)大跌95%的“顯卡門”事件,黃老板卻選擇把客戶爸爸得罪到底。
他對顯卡導(dǎo)致電腦過熱、燒機(jī)的問題輕輕揭過,后續(xù)蘋果主動找過來求定制化合作,也一口否決了。
兩種截然不同的態(tài)度,很大一部分原因出在話語權(quán)出現(xiàn)了轉(zhuǎn)移。
世紀(jì)初的主機(jī)時(shí)代,游戲機(jī)廠商掌握著“流量入口”,游戲的發(fā)行、運(yùn)營等都由索尼、任天堂等巨頭一條龍通吃,芯片供應(yīng)商通常只能“仰其鼻息”。
即便英偉達(dá)開創(chuàng)性提出GPU概念,并在顯卡領(lǐng)域一騎絕塵——從劃時(shí)代產(chǎn)品Geforce256開始,顯卡技術(shù)持續(xù)快速迭代,手握游戲行業(yè)2D轉(zhuǎn)3D的鑰匙,也逃脫不了被一錘定生死。
與微軟鬧掰之后,英偉達(dá)又直接錯過了微軟新規(guī)格的DirectX9,導(dǎo)致新推出的GeForce FX和微軟標(biāo)準(zhǔn)不兼容,加上產(chǎn)品本身不成熟,銷量慘淡。
而獲得微軟扶持的ATI,則推出了吊打英偉達(dá)GeForce FX的Radeon 9700,在GPU市場迅速崛起。2004年第三季度,在獨(dú)立顯卡市場中,ATI市場占有率為59%,英偉達(dá)只有37%。
然而,時(shí)間走到PC游戲市場,游戲機(jī)廠商們“流量入口”的壟斷地位被打破了。
在這一領(lǐng)域,產(chǎn)業(yè)核心在于游戲本身,更偏向于“游戲廠商隨心跑,硬件公司拼命追”,業(yè)內(nèi)研發(fā)、發(fā)行、硬件、軟件各有分工。
這意味著,比起游戲機(jī)時(shí)代屈指可數(shù)的索尼、任天堂、微軟們,芯片廠商的潛在客戶一下子擴(kuò)大到了產(chǎn)業(yè)鏈的角角落落。
如下圖,2004-2006年英偉達(dá)的營收持續(xù)增長,而其前五大客戶貢獻(xiàn)的收入占比卻持續(xù)下降。
同時(shí),這波由顯卡技術(shù)拉動“真3D”落地,疊加網(wǎng)絡(luò)、寬帶普及掀起的PC聯(lián)機(jī)潮,也對產(chǎn)業(yè)鏈上下游的芯片能力提出了更高要求。
以消費(fèi)端為例,這些畫面炫酷的游戲,因?yàn)閺?fù)雜的3D建模又被稱為電腦殺手,玩家的電腦更新?lián)Q代停不下。而他們對設(shè)備性能的追逐,倒逼PC廠商選擇以性能見長的芯片。
比如,2007年橫掃海內(nèi)外的《孤島危機(jī)》,畫面逼真讓人愛不釋手,但極考驗(yàn)顯卡的性能。有玩家回憶,“大學(xué)暑假打最終boss打了一天,每發(fā)核彈后,都要暫停冷卻電腦?!?/p>
這讓能流暢運(yùn)行《孤島危機(jī)》的英偉達(dá)Geforce9800GT顯卡,大受追捧,在全球賣出500多萬片。
說白了,相比主機(jī)行業(yè),做PC游戲的上游,只要做好性能、良率、價(jià)格上的平衡,就能全憑產(chǎn)品說話,不用做“低聲下氣”的乙方。
可以看到,2004年以來,英偉達(dá)GPU“每一輪更新,性能翻倍、價(jià)格持續(xù)下調(diào)”的公式在PC游戲市場大行其道。
不過,盯上這塊蛋糕的不止英偉達(dá),芯片巨頭們也不甘落后。
英特爾、AMD等老牌CPU玩家迅速切入GPU,宿敵ATI也步步緊逼,AMD甚至在2005年宣布與ATI合并,想通過CPU和GPU強(qiáng)強(qiáng)聯(lián)合,制霸行業(yè)。
一場惡戰(zhàn)本已近在眼前,沒想到ATI為賣個(gè)好價(jià)錢,大量買入過時(shí)的GPU技術(shù)專利,不僅讓AMD連年負(fù)債,也拖慢了GPU的整合節(jié)奏,AMD在持續(xù)迭代的芯片行業(yè)里泯然于眾人。
對手的掉隊(duì)讓英偉達(dá)頗為得意,正如黃仁勛炫耀的:“簡直是天上掉餡餅一樣的禮物,我們成為了世界上唯一一家獨(dú)立的圖形芯片公司?!?/p>
而技術(shù)在手、一家獨(dú)大的英偉達(dá),也自此有了和客戶掰手腕的能力。
比如,上述提到的“顯卡門”事件里撤單的戴爾、惠普,在英偉達(dá)推出新款產(chǎn)品后,又紛紛下單;轉(zhuǎn)向AMD后的蘋果,因效果不佳,不得不硬著頭皮,重啟英偉達(dá)合作。
但黃老板還沒笑多久,新的危機(jī)又悄然而至。
二、死磕GPU通用,讓大客戶繞不開
超級銷售員黃仁勛的知名事跡之一,就是在2013年的小米發(fā)布會上聲稱自己是米粉,大喊“請給我一個(gè)機(jī)會介紹英偉達(dá)!”
當(dāng)時(shí)的吃瓜群眾紛紛感慨黃老板能伸能屈,以為英偉達(dá)要死磕移動芯片市場。
誰料下一年,黃仁勛就放棄了自己一直狠舔的機(jī)會,宣布“將逐步退出智能手機(jī)和平板電腦芯片市場”。
黃仁勛當(dāng)時(shí)給出的解釋是:手機(jī)廠商激烈的價(jià)格競爭,讓上游也需要不斷降價(jià),但價(jià)格不是英偉達(dá)的強(qiáng)項(xiàng),只能退出。
但今天我們知道,價(jià)格戰(zhàn)只是表象,更深層的原因在于:移動端的芯片需求和英偉達(dá)追求的極致性能相悖。
PC市場的成功,讓黃仁勛比任何人都清楚,在芯片這個(gè)領(lǐng)域,擁有領(lǐng)先(甚至獨(dú)有)技術(shù)的公司,往往能分到更大的蛋糕以及擁有更深的護(hù)城河。
因此對移動端芯片,英偉達(dá)貫徹了“技術(shù)取勝”路線:Tegra系列一直瘋狂堆砌算力,Tegra 2到Tegra 3,GPU核心從8個(gè)變成了12個(gè),Tegra4更是激增到72個(gè),整個(gè)系列都被視為跑分利器。
然而,搭載在智能手機(jī)、平板電腦上的移動芯片,需要在有限的空間和電量下工作,更強(qiáng)調(diào)平衡的配置,拼性能的英偉達(dá)芯片,很快出現(xiàn)了能耗失控、發(fā)熱嚴(yán)重的問題。
更關(guān)鍵的是,通信信號技術(shù)被高通牢牢把握,手機(jī)廠商若與英偉達(dá)合作,還要另外花大價(jià)錢自配基帶,遂紛紛退避三舍。
這種情況下,英偉達(dá)若要繼續(xù)追求移動化,勢必要在性能上妥協(xié),而這并不符合“技術(shù)狂”黃仁勛的風(fēng)格,他決定“將精力重新集中在高性能、要求視覺計(jì)算或者游戲向的設(shè)備上”。
但市場對此并不買賬,彼時(shí)英偉達(dá)的主力市場PC游戲已經(jīng)結(jié)束了加速滲透階段,整個(gè)互聯(lián)網(wǎng)都處于火熱的移動換擋期,移動化失利不僅讓英偉達(dá)業(yè)務(wù)陷入了青黃不接,也意味著其為了追求技術(shù)放棄一個(gè)蓬勃的市場。
而英偉達(dá)已經(jīng)不止一次這樣一意孤行了,另一次可以追溯到2006年。
當(dāng)時(shí)在世人眼里,GPU還只是游戲裝備,黃仁勛偶然在華爾街看到一些做高頻交易和金融量化的人在用英偉達(dá)GPU跑交易,但他們只能編寫大量低級機(jī)器代碼實(shí)現(xiàn),無法像CPU那樣用C++等語言編程。
這讓黃仁勛意識到,市場對通用計(jì)算場景有一定的需求,回去就叫嚷著要加碼軟件開發(fā)(也就是CUDA平臺),讓GPU勝任各種任務(wù),而不只是用來給游戲領(lǐng)域繪制圖像。
一旦項(xiàng)目啟動,每年砸到上面的研發(fā)成本預(yù)計(jì)將達(dá)到5億美元,當(dāng)時(shí)英偉達(dá)全年收入才30億美元。
而且并行運(yùn)算帶來的巨大通用算力當(dāng)時(shí)并無明顯市場需求,最多用在了先進(jìn)物理實(shí)驗(yàn)室、量化交易等冷門領(lǐng)域,單個(gè)項(xiàng)目所需的GPU也僅限在個(gè)位數(shù),華爾街一度將CUDA技術(shù)估值為零。
也就是說,黃老板把公司1/6的收入,押注在一個(gè)與核心業(yè)務(wù)幾乎沒有關(guān)系、前景一眼望不到頭的軟件平臺上。
不僅是燒錢,為了搭載適配CUDA平臺,英偉達(dá)的芯片需要加入更多邏輯電路,這使得芯片面積增大,散熱需求增加,故障率也明顯增高。
上文提到的惠普、戴爾、蘋果等撤單事件,正是因?yàn)橛ミ_(dá)芯片發(fā)熱嚴(yán)重,致使大量筆記本電腦死機(jī)、故障。
但黃仁勛堅(jiān)信“這種制作軟件的方式可以改變一切”,哪怕掏了2億巨款賠償客戶,仍近乎偏執(zhí)地在CUDA上投入。
事實(shí)證明,他賭對了。
2012年底的ImageNet大賽上,基于英偉達(dá)芯片計(jì)算的卷積神經(jīng)網(wǎng)絡(luò)AlexNet,將識別正確率一舉提高到了84%,由此開啟了之后十年的AI革命。
這也讓英偉達(dá)GPU+CUDA組合,在深度學(xué)習(xí)領(lǐng)域一鳴驚人。曾嘲諷“GPU只是用來玩游戲”的谷歌瞬間成了英偉達(dá)的擁躉,微軟、Facebook等巨頭也下單了大量GPU來進(jìn)行人工智能訓(xùn)練。
而這只是開始,隨著深度學(xué)習(xí)領(lǐng)域不斷突破,巨頭們逐漸在多場景內(nèi)圍著英偉達(dá)“轉(zhuǎn)”。
比如,2015年深度學(xué)習(xí)在圖像識別領(lǐng)域的誤差率做到低于人類時(shí),自動駕駛市場爆發(fā),而在車端,發(fā)熱能耗不再是問題,被手機(jī)廠商嫌棄的Tegra芯片受到了車企青睞。
2016年AlphaGo代表AI戰(zhàn)勝李世石,又點(diǎn)燃了整個(gè)B端市場。
可以看到,各大廠面向各行各業(yè)B端客戶,開始提供基于深度學(xué)習(xí)的圖像識別、認(rèn)證、檢索等一系列AI服務(wù)產(chǎn)品。
除了互聯(lián)網(wǎng)、自動駕駛等行業(yè)對GPU需求高漲,生物醫(yī)藥、量化交易領(lǐng)域能應(yīng)用AI技術(shù)的公司也加入英偉達(dá)客戶行列。
數(shù)據(jù)顯示,截止到2016年,英偉達(dá)在深度學(xué)習(xí)領(lǐng)域的市占率高達(dá)97%。
至此,死磕GPU和CUDA性能的英偉達(dá),等來了“算力就是權(quán)力”的兌現(xiàn)時(shí)刻:大客戶們業(yè)務(wù)處處繞不開英偉達(dá),也就喪失了掀桌子資格。
這樣的話語權(quán)提升讓英偉達(dá)如沐春風(fēng),但也埋下了隱患。
三、自研芯片的大客戶,反被英偉達(dá)鉗制
2017年,英偉達(dá)的“一紙禁令”,引發(fā)了全球科技圈的眾怒:不再允許客戶使用GeForce產(chǎn)品在數(shù)據(jù)中心開展深度學(xué)習(xí)。
彼時(shí),英偉達(dá)正力捧高端新產(chǎn)品Tesla系列,該服務(wù)器與GeForce系列同架構(gòu),但價(jià)格天差地別,頂級版貴了近10倍。禁令的頒布,意味著客戶不能再用GeForce平替Tesla,家底薄的初創(chuàng)公司甚至可能斷送活路。
在一片抗議聲中,“惡龍行徑”最終停止了,但科技公司對英偉達(dá)的防備卻日漸加劇。
回看那幾年,谷歌、Meta、微軟等互聯(lián)網(wǎng)巨頭,特斯拉等電動車企業(yè),陸續(xù)下場自研芯片,企圖降低對英偉達(dá)GPU的依賴。
除了厭惡“英偉達(dá)稅”,自研芯片也比向英偉達(dá)采購更香。
以汽車行業(yè)為例,車端最需要卷算力的是智能駕駛系統(tǒng),但英偉達(dá)芯片卻是通用的“六邊形戰(zhàn)士”,不僅運(yùn)算速度不盡人意,體積還占了不小的空間。
而自研芯片則專門為無人駕駛而造,比如特斯拉的FSD芯片,面積相比巴掌大的英偉達(dá)DRIVE PX 2大大縮小,能耗也降至三分之一。
FSD芯片還優(yōu)先布置了負(fù)責(zé)深度學(xué)習(xí)和預(yù)測的NPU,相比于GPU在AI機(jī)器學(xué)習(xí)方面效率更高,算力也提高了5倍。
泛AI領(lǐng)域也類似,芯片從架構(gòu)、上層操作系統(tǒng)、中間件到業(yè)務(wù)代碼等環(huán)節(jié)做適配和改造,以追求極致的性能,谷歌的TPU芯片、亞馬遜的Graviton芯片都是如此。
其中,谷歌TPU在推理計(jì)算領(lǐng)域比英偉達(dá)GPU快了15-30倍,性能功耗比高出約30-80倍。
也就是說,自研芯片不僅可以量身定制,在性能、尺寸、功耗等方面也碾壓了英偉達(dá)的通用芯片。
更何況,當(dāng)下芯片雖然號稱“自研”,但并不需要全棧研發(fā),以特斯拉為例,除了NPU自研,其余CPU、GPU、接口等均采購標(biāo)準(zhǔn)IP,短短18個(gè)月就完成了開發(fā)。
因此,在大客戶掀起自研狂潮之后,英偉達(dá)就一直陷在“被顛覆”的質(zhì)疑之中。但大客戶們雖然有造芯的勇氣,想要替代英偉達(dá)卻不容易。
眾所周知,芯片制造的研發(fā)設(shè)計(jì)、場地設(shè)備等固定成本高到驚人,光流片就是一筆不菲的開銷,7納米芯片一次性流片成本約為2億人民幣。
基于此,這個(gè)行業(yè)一直是以“成本規(guī)模化”為核心的:對研發(fā)方來說,芯片可用場景越多,越能夠攤薄巨額研發(fā)成本;制造方則是一次性訂單量越多,越能夠充分調(diào)動產(chǎn)能利用率,將出貨利潤保持在一定水平。
可以看到,架構(gòu)通用的英偉達(dá),單個(gè)場景的研發(fā)開支能夠被攤薄。比如,汽車芯片Thor采用的Hopper架構(gòu),成本可能早就被同架構(gòu)的H100攤完了。
而這顯然是自研芯片多用于專用場景的大客戶們,所不具備的。如此一來,巨大的研發(fā)成本可能會讓他們望而卻步。
生產(chǎn)制造方面也一樣。有機(jī)構(gòu)曾算過一筆賬:假設(shè)車企每年120萬輛車,用120萬塊高算力芯片,每個(gè)月就是10萬,如果每張12吋晶圓為500顆芯片,每個(gè)月僅僅200張晶圓的需求。
這么點(diǎn)需求量,在臺積電只能算最小客戶,在封測廠也是。當(dāng)Fab和封測產(chǎn)能供不應(yīng)求時(shí),它們會優(yōu)先保證大客戶的供應(yīng)量,拉長排單等待時(shí)間。
再加上測試等環(huán)節(jié)的連鎖反應(yīng),芯片真正的應(yīng)用落地周期可能會變長。如特斯拉FSD芯片在2017年底完成首次試產(chǎn),但兩年后才開始裝車,更新迭代更慢。與之相比,英偉達(dá)基本每隔18個(gè)月就能更新?lián)Q代一次汽車芯片。
這迫使許多公司又重回英偉達(dá)的懷抱,尤其是大模型和生成式AI熱潮襲來之后,算力成了必爭資源,哪怕是仍在死磕自研的大廠,也不敢放棄采購英偉達(dá)的先進(jìn)GPU。
英偉達(dá)的算力芯片一躍成為不折不扣的硬通貨,坊間傳聞:Oracle創(chuàng)始人和馬斯克,曾在一家日料廳跪求了黃仁勛一小時(shí),只為拿到GPU芯片配貨。
據(jù)報(bào)道,英偉達(dá)每賣一張H100,能含淚賺1000%。AI相關(guān)產(chǎn)業(yè)50%的利潤,都流向了英偉達(dá)的口袋。
面對變本加厲的“英偉達(dá)稅”,大客戶們咬牙切齒,但束手無策——當(dāng)下芯片的競爭軟硬件并重,而英偉達(dá)不止手握芯片,還有軟件護(hù)城河CUDA。
十幾年來,CUDA作為一個(gè)函數(shù)庫、代碼庫,長期面向開發(fā)者開放,已經(jīng)吸引了數(shù)百萬開發(fā)人員,他們又開發(fā)了更多工具,讓CUDA的生態(tài)日臻成熟,幾乎成為了“基建”般的存在。
如果把GPU比作電廠,那么開發(fā)者就像造電器的人,而CUDA像“電網(wǎng)系統(tǒng)”,電器的電壓規(guī)格都是跟電網(wǎng)適配的。
這注定了CUDA的地位難以取代。去年,為了打破CUDA在軟件-芯片協(xié)同設(shè)計(jì)上的壟斷地位,英偉達(dá)的大客戶發(fā)起了“反CUDA聯(lián)盟”,試圖再造一個(gè)兼容CUDA的編譯工具。
然而等到第三方軟件公司的方案達(dá)到接近CUDA的水平,英偉達(dá)已經(jīng)發(fā)布下一代GPU了,軟硬件并駕齊驅(qū),讓挑戰(zhàn)者們始終處于追趕狀態(tài)。
更何況,嗅到危險(xiǎn)氣息的英偉達(dá),已經(jīng)開始高筑城墻:先是放話“買服務(wù)器機(jī)架,優(yōu)先獲得GB200”,捆綁銷售價(jià)格不菲的定制架子,加劇客戶遷移成本;接著又收緊反編譯政策,堵死其他工具兼容CUDA的路。
如此一來,那些自研芯片的大客戶們,最后還得淪為英偉達(dá)砧板上的肉。
小結(jié)
“先有仁勛后有天,顯卡在手虐神仙?!眹鴥?nèi)顯卡吧的英偉達(dá)“信眾”們,曾用《史記》體如此評價(jià)黃仁勛。
諸多風(fēng)口加持之下,正如黃仁勛所堅(jiān)信的那般,算力真的改變了世界,他的信仰得到了普遍認(rèn)可,他的力量甚至可以主宰市場。
但創(chuàng)造歷史的人,永遠(yuǎn)無法預(yù)見自己在歷史進(jìn)程中的坐標(biāo)。這決定了,對黃仁勛而言,每一天都是“枕戈待旦”的狀態(tài)。