界面新聞?dòng)浾?| 李如嘉
界面新聞編輯 | 文姝琪
3月19日,英偉達(dá)發(fā)布人形機(jī)器人通用基礎(chǔ)模型Project GR00T,旨在進(jìn)一步推動(dòng)其在機(jī)器人和具身智能方面的突破。
GR00T驅(qū)動(dòng)的機(jī)器人將能夠理解自然語(yǔ)言,并通過(guò)觀察人類行為來(lái)模仿動(dòng)作。其能快速學(xué)習(xí)協(xié)調(diào)各種技能,具備更好的靈活性,以適應(yīng)現(xiàn)實(shí)世界并與之互動(dòng)。
“開(kāi)發(fā)通用人形機(jī)器人基礎(chǔ)模型是當(dāng)今AI領(lǐng)域中最令人興奮的課題之一。世界各地的機(jī)器人技術(shù)領(lǐng)導(dǎo)者正在匯集各種賦能技術(shù),致力于在人工通用機(jī)器人領(lǐng)域?qū)崿F(xiàn)突破?!?/span>英偉達(dá)創(chuàng)始人兼CEO黃仁勛說(shuō)。
在他的GTC大會(huì)主題演講中,通過(guò)視頻展示了數(shù)臺(tái)這樣的機(jī)器人是如何完成各種任務(wù)的。
其中包括醫(yī)療和物流搬運(yùn)、分揀用的機(jī)械臂,也包括可以做打果汁等家務(wù)的人形家用機(jī)器人,還有的機(jī)器人可以模仿人類打架子鼓,也可以從視頻中學(xué)習(xí)人類的舞蹈動(dòng)作并進(jìn)行模擬?;诖笳Z(yǔ)言模型,有的人形機(jī)器人還可以理解人類的口頭指令,并做出回應(yīng)。
展示視頻之后,黃仁勛和身后由英偉達(dá)芯片和服務(wù)驅(qū)動(dòng)、訓(xùn)練的一列機(jī)器人一同向觀眾致意,畫面充滿了科幻感。
英偉達(dá)還發(fā)布了一款基于NVIDIA Thor系統(tǒng)級(jí)芯片(SoC)的新型人形機(jī)器人計(jì)算機(jī)Jetson Thor,并對(duì)NVIDIA Isaac機(jī)器人平臺(tái)進(jìn)行了重大升級(jí),包括生成式AI基礎(chǔ)模型和仿真工具,以及AI工作流基礎(chǔ)設(shè)施。
該SoC包括一個(gè)帶有transformer engine的下一代GPU,其采用NVIDIA Blackwell架構(gòu),可提供每秒800萬(wàn)億次8位浮點(diǎn)運(yùn)算AI性能,以運(yùn)行GR00T等多模態(tài)生成式AI模型。憑借集成的功能安全處理器、高性能CPU集群和100GB以太網(wǎng)帶寬,大大簡(jiǎn)化了設(shè)計(jì)和集成工作。
訓(xùn)練具身智能模型需要海量的真實(shí)數(shù)據(jù)和合成數(shù)據(jù)。新的Isaac Lab是一個(gè)GPU加速、性能優(yōu)化的輕量級(jí)應(yīng)用,基于Isaac Sim而構(gòu)建,專門用于運(yùn)行數(shù)千個(gè)用于機(jī)器人學(xué)習(xí)的并行仿真。
許多機(jī)器人正是在Isaac Lab中進(jìn)行大量訓(xùn)練,學(xué)習(xí)了如何完成任務(wù)。迪士尼生產(chǎn)的使用相關(guān)英偉達(dá)芯片的,名為Orange和Green的小型機(jī)器人也來(lái)到現(xiàn)場(chǎng),黃仁勛介紹,它們正是在Isaac平臺(tái)里學(xué)會(huì)了走路。
英偉達(dá)正在為人形機(jī)器人公司開(kāi)發(fā)一個(gè)綜合的AI平臺(tái),如1X Technologies、Agility Robotics、Apptronik、波士頓動(dòng)力公司等等。
“下一代機(jī)器人很有可能是人形機(jī)器人,因?yàn)槲覀冇懈嗟哪7掠?xùn)練數(shù)據(jù)可以提供給和我們構(gòu)造相似的機(jī)器人們。人形機(jī)器人可以更有效率地部署在人類設(shè)計(jì)的工作站、制造和物流環(huán)節(jié)中?!秉S仁勛說(shuō)。
隨著人口老齡化的加劇和勞動(dòng)力成本的持續(xù)上升,人形機(jī)器人行業(yè)正迎來(lái)發(fā)展機(jī)遇。GGII(高工產(chǎn)業(yè)研究院)報(bào)告顯示,到2026年,全球人形機(jī)器人市場(chǎng)規(guī)模有望超過(guò)20億美元。
而機(jī)器人在這個(gè)時(shí)間點(diǎn)爆發(fā),生成式AI是背后的最大推手。英偉達(dá)機(jī)器人和邊緣計(jì)算副總裁Deepu Talla在今年的CES上表示,有了大語(yǔ)言模型(LLM),機(jī)器人能夠更自然地理解和響應(yīng)人類指令;有了生成式AI,機(jī)器人能夠?qū)崿F(xiàn)前所未有的感知和適應(yīng)能力。高盛此前也表示,人形機(jī)器人將成為智能駕駛電動(dòng)車后的又一AI落地場(chǎng)景。
“AI和機(jī)器人硬件的結(jié)合確實(shí)是一個(gè)極具想象空間的事情,這是2023年為數(shù)不多的投資風(fēng)口之一?!毕榉逋顿Y管理合伙人夏志進(jìn)對(duì)界面新聞表示。
去年12月,特斯拉發(fā)布了Optimus機(jī)器人第二代,馬斯克表示部分Optimus很有可能在明年交付。緊接著今年1月,廚藝極佳的斯坦福機(jī)器人Mobile ALOHA火遍全網(wǎng)。3月,Figure發(fā)布OpenAI大模型加持的機(jī)器人Figure 01演示視頻再度刷屏,其能夠與人類進(jìn)行流暢對(duì)話,并分析執(zhí)行口頭指令。
英偉達(dá)也跟著這波浪潮,在2月宣布成立通用智能體研究實(shí)驗(yàn)室(GEAR),旨在虛擬和現(xiàn)實(shí)世界中構(gòu)建具身智能體基礎(chǔ)模型,專注于多模態(tài)基礎(chǔ)模型、通用型機(jī)器人研究、虛擬世界中的基礎(chǔ)智能體、模擬和仿真數(shù)據(jù)這四個(gè)領(lǐng)域。
在今年的GTC上,Agility Robotics、波士頓動(dòng)力公司、迪士尼和Google DeepMind等公司將在現(xiàn)場(chǎng)展出25款機(jī)器人及相關(guān)產(chǎn)品,包括人形機(jī)器人、機(jī)械臂、機(jī)器人視覺(jué)系統(tǒng)和高精度3D掃描系統(tǒng)等。
同時(shí),有多場(chǎng)會(huì)議與機(jī)器人有關(guān),涵蓋機(jī)器人操縱、導(dǎo)航、感知、計(jì)算、仿真/合成數(shù)據(jù)生成等多方面內(nèi)容。
有業(yè)內(nèi)聲音認(rèn)為,2024年或?qū)⒊蔀槿诵螜C(jī)器人量產(chǎn)的元年。大模型的井噴也的確讓人形機(jī)器人有了更多新機(jī)會(huì),但前提是技術(shù)瓶頸、高昂成本等老問(wèn)題不再成為新難題。
逐際動(dòng)力創(chuàng)始人張巍對(duì)界面新聞表示,現(xiàn)在大部分機(jī)器人只達(dá)到了“平地走兩步”的狀態(tài),讓它去順利地幫我們拿東西仍然很難。
在英偉達(dá)媒體溝通會(huì)上,Deepu Tella提到,目前還是人形機(jī)器人發(fā)展的初期階段,第一批使用的案例主要會(huì)集中在勞動(dòng)力短缺的制造業(yè),但隨著一些通用問(wèn)題的解決,人形機(jī)器人將更多地應(yīng)用于服務(wù)業(yè)、醫(yī)院甚至家庭。