文|有界UnKnown 錢江
編輯|山茶
11月底,黃仁勛在香港科技大學(xué)的博士學(xué)位授予儀式上,將人形機器人與汽車、無人機并肩列為未來會實現(xiàn)大規(guī)模量產(chǎn)的三種機器人。
這已經(jīng)不是黃仁勛第一次在公開場合“力挺”人形機器人,在今年3月份的英偉達GTC大會上,黃仁勛曾與1X Technologies、Agility Robotics、Boston Dynamics、Figure AI、宇樹等9個人形機器人同時登臺,發(fā)布英偉達人形機器人通用基礎(chǔ)模型——Project GR00T。
▲黃仁勛在GTC大會上 直播截圖
在之后的多個場合里,黃仁勛都向外界傳遞著相同的觀點:人形機器人將會成為人類生活里不可缺少的伙伴,它終將成為和汽車一樣的主流產(chǎn)品。
在關(guān)于人形機器人未來在人類生活中重要地位的看法上,黃仁勛也與馬斯克不謀而合。
馬斯克也曾在2024年特斯拉股東大會上表示,未來“全世界每個人都會想要一個機器人 ”,他認(rèn)為人形機器人和人類的比例,至少是2比1,甚至能到1比1,未來會有100億甚至200億、300億臺人形機器人。在一次采訪中,黃仁勛也坦言,“100年后大街上將到處都是人形機器人”,馬斯克則在X上默契地回復(fù),“人形機器人普及程度將是汽車10倍”。
▲馬斯克在X平臺上與黃仁勛互動 截圖
黃仁勛也幾乎成為除了馬斯克之外,最賣力為人形機器人站臺的科技大佬。但和馬斯克更側(cè)重于造出人形機器人本體、并將其應(yīng)用于特斯拉的生產(chǎn)和勞動力補給上不同,黃仁勛更專注于做人形機器人的技術(shù)服務(wù)商。
英偉達機器人和邊緣計算副總裁Deepu Talla在東京的一次會議上直言,英偉達瞄準(zhǔn)的是一個由“數(shù)十萬”家機器人制造商組成的分散市場,而不是由少數(shù)幾家主要參與者主導(dǎo)的集中式智能手機市場,“我們?yōu)闄C器人提供平臺,而不是制造機器人”。
那么,英偉達究竟想要做一個什么樣的機器人平臺?
01 打造人形機器軟件生態(tài)
2021年,波士頓動力曾發(fā)布一則Atlas的跑酷視頻,在全球范圍內(nèi)第一次掀起了人形機器人的狂熱。
在這則視頻中,Atlas可以輕而易舉地在各種形狀和坡度的踏板之間跳躍、奔跑、上下階梯。但很多人都不知道,在這則驚艷世界的視頻背后,是Atlas十多年如一日的訓(xùn)練。
機器人和人一樣,要學(xué)會走路也需要經(jīng)過無數(shù)次的訓(xùn)練,通過積累足夠多的數(shù)據(jù)才能實現(xiàn)。對于早期的人形機器人而言,積累數(shù)據(jù)沒有捷徑,只能通過一次又一次的跌倒來完成。
所以在Atlas早期的訓(xùn)練視頻中,我們會看到它身邊時刻都跟隨著好幾個工作人員,以便在它“倒下”的時候及時檢查零件。
但這個過程顯然太過漫長,不利于人形機器人快速發(fā)展。為了提高人形機器人的訓(xùn)練效率,人們在AI、大數(shù)據(jù)和云計算等前沿技術(shù)的基礎(chǔ)上,建立了一套利用虛擬世界對人形機器人進行訓(xùn)練的方法。
通常來講,人形機器人的訓(xùn)練,會經(jīng)歷一個從Real2Sim(真實到虛擬)到Sim2Real(虛擬到真實)的過程。也就是先從真實環(huán)境采集數(shù)據(jù)投入到仿真環(huán)境,讓機器人在仿真環(huán)境里做充分學(xué)習(xí)和訓(xùn)練,再將其拉到現(xiàn)實世界里歷練。
這個過程由于有相當(dāng)一部分在虛擬環(huán)境中進行,因此不僅可以加快訓(xùn)練速度,還可以降低硬件損耗。
英偉達在人形機器人領(lǐng)域的第一個布局,就是搭建一套仿真訓(xùn)練設(shè)施,它具體包括人形機器人仿真訓(xùn)練場需要使用的虛擬場所構(gòu)建、人形機器人與環(huán)境互動的仿真訓(xùn)練,以及人形機器人控制規(guī)劃學(xué)習(xí)的仿真訓(xùn)練。
它們分別對應(yīng)著虛擬協(xié)作和仿真平臺Omniverse、用于機器人行為仿真的平臺Isaac Sim、用于機器人算法訓(xùn)練與優(yōu)化的平臺Isaac Lab。
▲英偉達人形機器人軟件生態(tài),有界UnKnown制圖
用一個形象的比喻,Omniverse就像一座城市,這座城市里有高樓林立的大廈、車水馬龍的道路以及人類生活所需要的一切基礎(chǔ)設(shè)施,而人形機器人就像生活在這座城市的人類一樣,他們在城市之中穿梭、從事勞動活動。
Isaac Sim就像是Omniverse這座城市里的健身房一樣,人形機器人需要在這個健身房不斷與各類運動器材進行磨合,這就對應(yīng)著人形機器人與環(huán)境交互的能力訓(xùn)練,它們需要了解路徑規(guī)劃,比如怎么樣才能正確抵達所需要的運動器材面前,并且了解每一種器材的使用方法,比如看到啞鈴知道是用來抓取的、看到跑步機就知道是用來跑步的。開發(fā)者使用Isaac Sim來測試機器人在不同環(huán)境中的表現(xiàn),不需要實際硬件即可驗證機器人的動作和決策。
Isaac Lab就像Omniverse這座城市里的圖書館一樣,人形機器人需要在這座圖書館之中不斷更新知識,它主要聚焦于算法開發(fā)與訓(xùn)練,為機器人提供決策和控制能力,允許開發(fā)者在虛擬環(huán)境中開發(fā)、測試和優(yōu)化機器人控制和智能算法。
▲英偉達GTC 2024大會,Isaac Lab環(huán)境里的Digit
所以,Omniverse是一個讓機器人學(xué)習(xí)如何更好適應(yīng)現(xiàn)實世界的地方,在這樣的虛擬環(huán)境中,機器人可以進行智力訓(xùn)練和動作訓(xùn)練?;贠mniverse,英偉達開發(fā)了機器人開發(fā)仿真平臺和參考應(yīng)用程序Isaac Sim和開源的模塊化機器人學(xué)習(xí)框架Isaac Lab。
總的來說,英偉達這一套人形機器人軟件生態(tài),能夠為機器人數(shù)據(jù)訓(xùn)練提高效率、降低成本,讓機器人可以不必在復(fù)雜的硬件環(huán)境中磕磕碰碰,在進入真實環(huán)境之前,能夠先在虛擬世界里“練兵”。
在今年3月份的英偉達GTC大會上登臺的9家人形機器人,就是這套生態(tài)的首批“種子用戶”。
在這樣一套仿真機制的配合之下,英偉達發(fā)布了具身智能通用大模型——Project GR00T,與迪士尼動畫《銀河護衛(wèi)隊》中的小樹人格魯特同名,寓意著人形機器人可以如動畫中的格魯特一樣擁有超凡的力量。
GROOT使得機器人能夠理解和處理自然語言,并且具備多模態(tài)感知能力,即它能夠通過視覺、聽覺等多種感官輸入來進行信息處理。
但只做軟件生態(tài),還無法滿足英偉達這樣一家以芯片起家的公司的野心。
02 為人形機器人造“芯”
對于英偉達來說,公司的根本一直都是硬件,是GPU。
因此在人形機器人領(lǐng)域,黃仁勛也同樣希望能夠延續(xù)英偉達在游戲、在AI、在智能汽車領(lǐng)域的神話,做出遙遙領(lǐng)先的芯片。
一個人形機器人也是由多個“芯片器官”組成的,每個芯片負(fù)責(zé)不同的任務(wù),讓機器人能夠像人一樣思考、感知、行動、交流和生活。人形機器人需要6-8種不同類型的芯片,包括中央控制、運動、視覺、語音、傳感器和通信處理芯片,以完成全身調(diào)度、環(huán)境感知和與人類交流。
▲人形機器人所需要的芯片,有界UnKnown制圖
而這些芯片中,有兩類是比較關(guān)鍵的。一類是控制機器人運動路線的芯片,另一類是幫助機器人思考的芯片。
以特斯拉的人形機器人Optimus為例,這兩塊芯片分別使用的是特斯拉汽車上使用的FSD自動駕駛芯片,以及特斯拉訓(xùn)練自動駕駛而專門開發(fā)DOJO芯片。
在自動駕駛芯片方面,英偉達一直遙遙領(lǐng)先,其最新發(fā)布的DRIVE AGX Thor可提供高達2000TFLOPS的算力,是目前算力最高、效果最好的自動駕駛芯片。
而英偉達的人形機器人芯片就與Thor同出一源。
今年11月中旬,華爾街日報曾報道,英偉達計劃在2025年推出面向人形機器人的專用芯片Jetson Thor,在快速增長的機器人行業(yè)中占據(jù)一席之地。
Jetson Thor具備高性能AI推理能力,支持運行如GR00T等大型多模態(tài)生成式AI模型,采用英偉達最新的Blackwell架構(gòu),并配備Transformer引擎,可以支持人形機器人在視覺、語音和觸覺等多模態(tài)感知下的交互,增強其與人類的自然交流能力。這也是英偉達首次公開宣稱專門為人形機器人打造的芯片平臺。
Jetson是英偉達旗下專為 AI 應(yīng)用設(shè)計的緊湊型計算機平臺,其芯片除了機器人之外,還應(yīng)用在無人機、智能家居、醫(yī)療設(shè)備和工業(yè)自動化等場景。
Jetson平臺最早可以追溯到2014年,這也是英偉達在機器人領(lǐng)域布局的開始。
這一年,物聯(lián)網(wǎng)、邊緣計算、人工智能和機器人技術(shù)開始嶄露頭角,市場對與之匹配的芯片需求也在持續(xù)擴大。同時,這一年人形機器人也開始投入初期應(yīng)用。軟銀在這一年推出Pepper,它是全球首款能夠識別和回應(yīng)人類情感的商用人形機器人;法國Aldebaran Robotics公司開發(fā)NAO機器人,開始投入教育領(lǐng)域,幫助學(xué)生學(xué)習(xí)編程、科學(xué)和數(shù)學(xué)。
也是在這一年,英偉達上線Jetson TK1芯片,它具備更強的圖形處理能力和AI處理能力,采用了基于Kepler架構(gòu)的GPU,并結(jié)合了ARM Cortex-A15 CPU,適用于低功耗設(shè)備。雖然它并不是直接針對人形機器人,但卻為人形機器人處理復(fù)雜的視覺感知和計算提供了硬件支持。
隨后,幾乎每隔一兩年,英偉達Jetson系列都會發(fā)布新產(chǎn)品,其中Jetson Xavier 和Jetson Orin相關(guān)系列對人形機器人的發(fā)展提供支持,并且它們清一色都是推理芯片。
▲英偉達Jetson芯片應(yīng)用介紹
雖然Jetson AGX Xavier和Jetson Orin系列適用于機器人領(lǐng)域,但并非專門為人形機器人而設(shè)計,它們同樣適用于無人機、自動駕駛等產(chǎn)品。
而計劃于2025年上線的Jetson Thor則是專為人形機器人打造的,根據(jù)英偉達官方表示,Jetson Thor能夠執(zhí)行復(fù)雜任務(wù),并與人和機器安全、自然地交互,它采用英偉達最新的Blackwell架構(gòu),并配備Transformer引擎,可以支持人形機器人在視覺、語音和觸覺等多模態(tài)感知下的交互,增強其與人類的自然交流能力。
結(jié)語
人形機器人并非黃仁勛首次做趨勢性預(yù)測的領(lǐng)域,在黃仁勛的輝煌歷史中,曾連續(xù)兩次“押對寶”。
1999年,中央處理單元(CPU)仍然是計算機系統(tǒng)的核心,雖然圖形處理的需求不斷增長,但CPU主要負(fù)責(zé)所有的計算任務(wù),包括圖形渲染。當(dāng)時,雖然圖形顯卡市場也在發(fā)展,但多數(shù)顯卡只能提供基礎(chǔ)的2D圖形渲染,并且較少具備3D加速能力。
黃仁勛卻在這一年推出GeForce GPU系列,發(fā)布GeForce256,成為世界上第一款GPU,也是首個支持硬件加速的實時3D圖形渲染的圖形處理單元。
它給游戲玩家?guī)砹饲八从械捻槙丑w驗,根據(jù)“英偉達中國”紀(jì)念1999年這款GPU的相關(guān)文章描述,與GeForce256結(jié)合的游戲《虛幻競技場》是首批擁有逼真反射效果的游戲之一,在發(fā)布的第一年內(nèi),便售出了超過100萬份。[1]
2006年,黃仁勛發(fā)布并行計算平臺和編程模型“CUDA”,使得GPU具備處理通用計算任務(wù)的能力,CUDA的發(fā)布被夸張地形容為一場“災(zāi)難”。如果將GPU形容為一個擁有上千個工人的工廠,可以驅(qū)動工人同時處理成千上萬的圖形像素,那么,CUDA就像這群工廠工人的管理系統(tǒng),它不僅能做圖像渲染,還能做科學(xué)計算、分析大數(shù)據(jù)、訓(xùn)練AI模型。
這兩次,黃仁勛都贏在芯片上。
那么,在人形機器人領(lǐng)域,除了做仿真訓(xùn)練平臺,黃仁勛為人形機器人這個“新物種”造的“芯”,能讓英偉達再次站在新的時代高點嗎?
也許,不到100年,就能看到大街上到處行走的人形機器人。