文丨智駕網(wǎng) 王欣
連續(xù)幾個(gè)月霸屏科技圈頭條,只是“皮衣老黃”黃仁勛的開胃菜。
正菜是這次他在中國(guó)臺(tái)北國(guó)際電腦展前夕發(fā)表的演講。
北京時(shí)間6月2日晚,英偉達(dá)創(chuàng)始人黃仁勛舉辦了一場(chǎng)名為“揭開新工業(yè)革命”的主題演講。他花了兩個(gè)小時(shí)詳細(xì)闡述自己對(duì)“GPU加速AI計(jì)算革命”及“AI工廠”的理解。
而硬核信息是去年發(fā)布的Blackwell芯片開始投產(chǎn),2025年將推出Blackwell Ultra,而下一代 AI 芯片架構(gòu)平臺(tái)名為Rubin,采用HBM4芯片,預(yù)計(jì)將于2026年推出。
同時(shí),黃仁勛還宣布推出推理模型微服務(wù)NVIDIA NIM,以部署在云、數(shù)據(jù)中心或工作站上,并且開發(fā)者能夠輕松地為Copilot、ChatGPT等構(gòu)建生成式 AI 應(yīng)用,所需時(shí)間從數(shù)周縮短至幾分鐘。
同時(shí),英偉達(dá)面向GeForce RTX AI電腦平臺(tái)推出AI助理,為數(shù)字人推出G-Assist和NVIDIA ACE(數(shù)字人技術(shù)) NIMs,以及為微軟Windows Copilot Runtime推出用于RTX加速API的小語(yǔ)言模型(SLM)等等。
而在這一系列新產(chǎn)品與新預(yù)言中,最具看點(diǎn)的是其展示的GPU全新一代的Rubin架構(gòu)。
在黃仁勛看來(lái),生成式AI剛剛打開了軟件編寫軟件的歷史,而一步,或者說(shuō)新一代的工業(yè)革命正是機(jī)器來(lái)生產(chǎn)機(jī)器。
01.
盡管英偉達(dá)才剛推出了新的Blackwell平臺(tái),卻開始了預(yù)告下一代Rubin GPU架構(gòu)路線圖的野心計(jì)劃。
黃仁勛表示,Blackwell的下一代架構(gòu)將是Rubin架構(gòu),且Rubin GPU將采用8顆HBM4,而Rubin Ultra GPU將采用12顆HBM4。
這個(gè)新的架構(gòu)以美國(guó)天文學(xué)家Vera Rubin命名,她被視為發(fā)現(xiàn)宇宙中的暗物質(zhì)的第一人,并在研究銀河系等星系自轉(zhuǎn)速度方面做了開創(chuàng)性的工作。
黃仁勛透露了GPU的更迭計(jì)劃:
“我們公司有一年的節(jié)奏。我們的基本理念很簡(jiǎn)單:建立整個(gè)數(shù)據(jù)中心規(guī)模,然后以一年的節(jié)奏拆解并出售給您,并將一切推向技術(shù)極限?!?/p>
這意味著英偉達(dá)新的GPU架構(gòu)將從兩年一次迭代,加速到以一年為周期推出。
2024 年:Blackwell 芯片現(xiàn)已開始生產(chǎn)
2025 年:推出 Blackwell Ultra 產(chǎn)品
2026 年:推出 Rubin 產(chǎn)品
2027 年:推出 Rubin Ultra 產(chǎn)品
根據(jù)外媒wccftech的消息,英偉達(dá)的Rubin GPU將采用4x光罩設(shè)計(jì),并將使用臺(tái)積電的CoWoS-L封裝技術(shù),并采用N3制程。此外,英偉達(dá)將使用下一代HBM4 DRAM來(lái)為其Rubin GPU提供動(dòng)力,目前英偉達(dá)在其B100 GPU中使用最快的HBM3E存儲(chǔ)器,并預(yù)計(jì)在2025年底當(dāng)HBM4存儲(chǔ)器解決方案大幅量產(chǎn)時(shí),用HBM4版本來(lái)更新這些芯片。
02.
當(dāng)前CPU面臨的困境是什么?
在黃仁勛看來(lái),當(dāng)今 CPU 性能擴(kuò)展的速度已經(jīng)大大減緩,盡管我們需求的計(jì)算量仍然在以指數(shù)級(jí)的速度非??焖俚胤?。如果處理需求、我們需要處理的數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),但性能卻沒(méi)有相應(yīng)增長(zhǎng),我們將經(jīng)歷計(jì)算的「通貨膨脹」(computation inflation)。事實(shí)上,就在我們現(xiàn)在說(shuō)話的時(shí)候,世界各地使用的數(shù)據(jù)中心電力數(shù)量正在大幅增長(zhǎng)。計(jì)算機(jī)的成本正在不斷增長(zhǎng)。這當(dāng)然不能再繼續(xù)下去了,因?yàn)閿?shù)據(jù)將繼續(xù)呈指數(shù)級(jí)增長(zhǎng),但 CPU 性能擴(kuò)展速度將永遠(yuǎn)不會(huì)恢復(fù)。
比如說(shuō)對(duì)比英偉達(dá)2016年發(fā)布的Pascal GPU,Blackwell GPU的計(jì)算能力(對(duì)應(yīng)人工智能浮點(diǎn)運(yùn)算能力)增長(zhǎng)了1000倍,幾乎“超越了摩爾定律在最佳時(shí)期的增長(zhǎng)”。
黃仁勛一貫堅(jiān)持“買的越多,省得越多”的理念。
GPU和CPU組合在一起,實(shí)現(xiàn)了高達(dá)100倍的加速計(jì)算,同時(shí)功耗僅增加三倍,換算下來(lái)平均單位性能比單獨(dú)使用CPU提高25倍,顯著起到了節(jié)能、降成本的效果。
而100倍的速度意味著97%、98%的節(jié)省,所以當(dāng)GPU+CPU的組合從100倍的速度到200倍的速度再到1000倍的速度,節(jié)省、計(jì)算的邊際成本就會(huì)繼續(xù)下降。
黃仁勛的設(shè)想是,隨著人工智能模型繼續(xù)擴(kuò)大,對(duì)GPU性能的要求也將越來(lái)越高,傳統(tǒng)數(shù)據(jù)中心將進(jìn)化為“AI工廠”,而工廠的基石便是超級(jí)GPU。
演講過(guò)程中,黃仁勛甚至還親自搬上一臺(tái)體型更大的DGX服務(wù)器。這臺(tái)服務(wù)器上連接了8個(gè)Blackwell GPU,采用空氣冷卻技術(shù)散熱。目前全球搶購(gòu)的AI服務(wù)器都用到這款產(chǎn)品,也是各大數(shù)據(jù)中心的核心設(shè)備。
其中DGX的AI算力提升到上一代的45倍,達(dá)到1440PFLOPS,而能耗僅為上一代的10倍。
黃仁勛極力描繪著生成式AI時(shí)代的一幅藍(lán)圖,展示了英偉達(dá)如何從Blackwell芯片等一系列先進(jìn)技術(shù)和產(chǎn)品的組合,壘起層層疊疊的機(jī)架、集群,最終形成由32000張GPU組成的AI工廠。
03.
一座AI工廠到底如何掀起新產(chǎn)業(yè)革命?
這次演講,黃仁勛宣布推出推理模型微服務(wù)NIM,能將企業(yè)部署生成式AI應(yīng)用的時(shí)間從幾天壓縮到幾分鐘,這個(gè)微服務(wù)可以用于研究、開發(fā)和測(cè)試。
該服務(wù)提供了一種簡(jiǎn)單、標(biāo)準(zhǔn)化的方式,通過(guò)經(jīng)優(yōu)化的容器形式提供AI模型,可部署在云、數(shù)據(jù)中心或工作站上。
現(xiàn)在,全球2800萬(wàn)開發(fā)者可下載NIM,從而輕松構(gòu)建Copilot、聊天機(jī)器人等生成式AI應(yīng)用。
04.
如果你有聽黃仁勛在今年GTC上演講內(nèi)容,會(huì)發(fā)現(xiàn)具身智能占到居多篇幅。
黃仁勛堅(jiān)信下一波AI浪潮是物理AI,機(jī)器人時(shí)代已經(jīng)到來(lái),所有移動(dòng)的物體都將實(shí)現(xiàn)自動(dòng)化。
英偉達(dá)這次發(fā)布了Isaac機(jī)器人平臺(tái)。
黃仁勛表示,我們正在努力通過(guò)推進(jìn)英偉達(dá)機(jī)器人堆棧來(lái)加速生成物理 AI,包括用于模擬應(yīng)用的Omniverse、Project GR00T人形基礎(chǔ)模型和 Jetson Thor機(jī)器人計(jì)算機(jī)。
目前,Isaac 生態(tài)系統(tǒng)迅速擴(kuò)張,包括西門子、比亞迪、Gideon、idealworks和RGo Robotics等都在與英偉達(dá)展開合作。
其他一系列新產(chǎn)品服務(wù)的落地情況,還有為專為AI打造的新型以太網(wǎng)Spectrum-X等。
一年前,黃仁勛曾在臺(tái)大畢業(yè)典禮上提出了一個(gè)這樣的問(wèn)題:
2023年畢業(yè)的同學(xué)們,你們即將進(jìn)入一個(gè)經(jīng)歷巨大變革的世界,就像我畢業(yè)時(shí)遇到個(gè)人電腦和芯片革命時(shí)一樣,你們正處于AI的起跑線上。每個(gè)行業(yè)都將被革命、重生,為新思想做好準(zhǔn)備——你們的思想。在40年的時(shí)間里,我們創(chuàng)造了個(gè)人電腦、網(wǎng)路、移動(dòng)設(shè)備、云端技術(shù)?,F(xiàn)在的AI時(shí)代,你們將創(chuàng)造什么?
彼時(shí)英偉達(dá)的市值超過(guò)了1萬(wàn)億美元,這一時(shí)刻與生成式AI爆發(fā)對(duì)GPU需求增長(zhǎng)的節(jié)點(diǎn)吻合。
05.
一年過(guò)后的現(xiàn)在,英偉達(dá)市值超過(guò)2.7萬(wàn)億美元,成為直逼蘋果挑戰(zhàn)全球第二大市值地位的公司。
根據(jù)Google財(cái)經(jīng)的數(shù)據(jù),截止目前,蘋果的市值為2.95萬(wàn)億美元,而英偉達(dá)的市值為2.7萬(wàn)億美元。參考路透社的解釋認(rèn)為,英偉達(dá)仍受益于人工智能熱潮,但蘋果目前正苦于IPhone需求疲軟和中國(guó)市場(chǎng)的激烈競(jìng)爭(zhēng)。
今年,英偉達(dá)市值已從1萬(wàn)億美元增長(zhǎng)到2萬(wàn)億美元,一舉超越亞馬遜、谷歌和沙特的石油公司。
這不禁讓智駕網(wǎng)想到此前在社交平臺(tái)上看到的一幕——
一位國(guó)外網(wǎng)友在社交平臺(tái)評(píng)論稱:“一百年后,人們會(huì)記得蘋果還是英偉達(dá)?”
另一位網(wǎng)友模仿老黃的口吻回答:“the future is generative AI!”