正在閱讀:

大模型這把“火”,燒到了人形機(jī)器人

掃一掃下載界面新聞APP

大模型這把“火”,燒到了人形機(jī)器人

人形機(jī)器人,正在重新回到熟悉的聚光燈下。

文|讀懂財(cái)經(jīng)

如果大模型是雷神之錘,那么適合它的釘子在哪?過去一年里,所有人都在急切地尋找這個(gè)問題的答案。人形機(jī)器人,可能是所有科技公司為數(shù)不多的一個(gè)共識(shí)。

近日,據(jù)外媒報(bào)道,微軟與OpenAI正洽談參與人形機(jī)器人公司Figure的新一輪融資,本輪融資金額最高可能達(dá)5億美元。

這已經(jīng)是OpenAI出手投資的第二家人形機(jī)器人公司。這并不是孤例。幾乎所有布局大模型的人和公司,都在研究人形機(jī)器人有著濃厚的熱情,并投入了研究資源。從英偉達(dá)到谷歌,從亞馬遜到Meta,甚至包括馬斯克,莫不是如此。

作為一個(gè)曾經(jīng)經(jīng)歷幾度起伏的高科技技術(shù),市場對(duì)人形機(jī)器人的熱情被AI 大模型徹底“點(diǎn)燃”。正如很多人預(yù)期的那樣,在在生成式AI通過AGI(人工通用智能)的道路上,人形機(jī)器人是不可或缺的重要硬件載體。

人形機(jī)器人,正在重新回到熟悉的聚光燈下。

/ 01 / 機(jī)器人熱情由來已久

此次投資Figure,并不是OpenAI第一次投資人形機(jī)器人公司。去年3月,來自挪威的人形機(jī)器人初創(chuàng)企業(yè) 1X Technologies(簡稱:1X),獲得了一輪由 OpenAI 創(chuàng)業(yè)基金領(lǐng)投的 2350 萬美元融資,成為了 OpenAI 投資的第一家硬件公司。

OpenAI的初創(chuàng)企業(yè)基金全稱是“OpenAI Startup Fund”,投資方向更側(cè)重于率先實(shí)現(xiàn)AI技術(shù)落地的方向。這也是OpenAI投資1X的重要邏輯。OpenAI一名高管曾公開表示,“投資1X瞄準(zhǔn)的時(shí)機(jī)是其機(jī)器人硬件已經(jīng)成熟,能夠在AI的加持下開拓更廣泛的勞動(dòng)力市場?!?/p>

如今,再次加注機(jī)器人賽道,說明OpenAI對(duì)人形機(jī)器人賽道的高度看好。作為人形機(jī)器人領(lǐng)域領(lǐng)先的創(chuàng)業(yè)公司,1X和Figure都已經(jīng)推出了人形機(jī)器人的產(chǎn)品。

其中,1X共有兩款機(jī)器人產(chǎn)品,工作機(jī)器人EVE和正在研發(fā)的家用雙足機(jī)器人NEO。而Figure也在去年發(fā)布了第一款通用人形機(jī)器人Figure 01,目前Figure已經(jīng)與寶馬達(dá)成協(xié)議,將在汽車制造領(lǐng)域部署“通用人形機(jī)器人”。

事實(shí)上,OpenAI對(duì)人形機(jī)器人的熱情由來已久,比大家想象得更高,甚至OpenAI還一度專門在內(nèi)部成立了一個(gè)機(jī)器人部門。

早在2017年,OpenAI的機(jī)器人團(tuán)隊(duì),就發(fā)布過用于模擬機(jī)器人控制的開源軟件Roboschool。2018年,團(tuán)隊(duì)研發(fā)出來的機(jī)械臂已經(jīng)能自如地“盤核桃”,即靈活把玩木塊。當(dāng)然,OpenAI機(jī)器人團(tuán)隊(duì)最著名的研究,是它研發(fā)的機(jī)械手,單手就能擰魔方:

當(dāng)然,對(duì)人形機(jī)器人情有獨(dú)鐘的大模型企業(yè)還不止OpenAI。一個(gè)有趣的現(xiàn)象是,幾乎每一個(gè)在大模型領(lǐng)域有所建樹的企業(yè),都或多或少地布局了人形機(jī)器人。

就拿谷歌來說,去年10月DeepMind發(fā)布RT-X機(jī)器人大模型,并開放訓(xùn)練數(shù)據(jù)集Open X-Embodiment。今年1月,谷歌DeepMind團(tuán)隊(duì)和斯坦福大學(xué)華人團(tuán)隊(duì)合作研發(fā)的能炒菜、做家務(wù)的通用機(jī)器人Mobile ALOHA刷屏全網(wǎng)。

至于馬斯克就更不用說,去年7月成立了一家名為X.Al的人工智能公司,今年年底,特斯拉推出了人形機(jī)器人擎天柱,并有望在明年實(shí)現(xiàn)交付。

AI大模型落地過程中,人形機(jī)器人究竟扮演著怎么角色,能夠受到這么多的青睞?

/ 02 / 人形機(jī)器人,AGI的“答案”?

在說大模型與人形機(jī)器人關(guān)系之前,我們需要先對(duì)什么是人形機(jī)器人有一個(gè)認(rèn)知。

必須明確一點(diǎn)的是,機(jī)器人并不是一個(gè)新興事物。在人形機(jī)器人出來之前,工業(yè)機(jī)器人已經(jīng)是一個(gè)超過500億的市場,并廣泛應(yīng)用于汽車、3C、紡織、包裝等行業(yè)。

但是工業(yè)機(jī)器人也有很明顯的弊端,就是通用性不足。傳統(tǒng)的工業(yè)機(jī)器人并不能直接使用,需要被系統(tǒng)集成商集成后使用。機(jī)器人的系統(tǒng)集成不僅需要結(jié)合對(duì)客戶工藝的理解高度定制,同時(shí)也是嚴(yán)重依賴工程師的經(jīng)驗(yàn)。這注定了工業(yè)機(jī)器人適用于大規(guī)模、重復(fù)性生產(chǎn)的工作。

與其說,工業(yè)機(jī)器人是機(jī)器人,倒不如說其更像是自動(dòng)化設(shè)備。在這一點(diǎn)上,人形機(jī)器人無疑更接近我們對(duì)機(jī)器人的理解。

人形機(jī)器人,顧名思義就是形態(tài)更接近人的機(jī)器人。但外在的形態(tài)不過是表象,其內(nèi)核的特點(diǎn)是機(jī)器人的智能性和通用性。之所以選擇“人形”,只是因?yàn)槲覀兓顒?dòng)的世界是為人的身體所創(chuàng)造的,人的形態(tài)可以操作一切工具,具有最廣泛的適應(yīng)性。

從物理維度上說,人形機(jī)器人由三個(gè)模塊組成,分別是“肢體”“小腦”和“大腦”,其中“肢體”由靈巧手、傳感器等一系列硬件組成,“小腦”負(fù)責(zé)運(yùn)動(dòng)控制,“大腦”則主導(dǎo)機(jī)器人的環(huán)境感知、推理決策和語言交互。

而大模型的出現(xiàn),將語義理解能力和推理生成能力引入其中,相當(dāng)于給人形機(jī)器人換了個(gè)“大腦”。 大模型對(duì)人形機(jī)器人的提升主要體現(xiàn)在兩個(gè)方面:感知能力和思考決策能力。

先說感知能力,大模型的強(qiáng)擬合能力使得人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語義分割等任務(wù)時(shí)有可能實(shí)現(xiàn)更高的高精確度。舉個(gè)例子,現(xiàn)在AI已經(jīng)可以做到識(shí)別障礙物,但是如果路邊有個(gè)人舉個(gè)牌子,說前方橋斷請(qǐng)繞行。過去的AI很難理解這種情況,但基于大模型的人形機(jī)器人卻有可能識(shí)別、理解這些信息。

思考決策能力的意思是,人形機(jī)器人具備較好的知識(shí)完備性,能夠把一個(gè)指令拆解成多個(gè)子任務(wù)和子指令,在不同場景去完成各種任務(wù)。比方說,你和機(jī)器人說“把飯熱一下”,它知道要去找微波爐。

隨著谷歌、英偉達(dá)等公司對(duì)大模型+機(jī)器人探索的深入,上述積極影響也得到了證實(shí)。2022 年 12 月,谷歌發(fā)布了RT-1模型。這是一個(gè)基于機(jī)器人數(shù)據(jù)的端到端模型,輸入端是一小段圖像序列和用文本描述的任務(wù),輸出端是動(dòng)作指令,包括7個(gè)維度的手臂動(dòng)作指令、3個(gè)維度的基礎(chǔ)移動(dòng)指令和1個(gè)維度的狀態(tài)切換指令。

研究人員讓機(jī)器人執(zhí)行了超過 700 項(xiàng)任務(wù),結(jié)果顯示:在之前見過的場景、之前未見過的場景、被干擾場景、背景更換場景,搭載 RT-1 模型的機(jī)器人都展現(xiàn)出了更高的成功率。

值得一提的是,這是機(jī)器人首次通過龐大的、多樣化的、任務(wù)無關(guān)的數(shù)據(jù),展現(xiàn)出泛化性,執(zhí)行了一些未曾見過的任務(wù)。

去年7月,谷歌發(fā)布了RT-2,這是一個(gè)視覺—語言—?jiǎng)幼髂P?。在這個(gè)模型里,谷歌將參數(shù)量從35M提高到55B。研究人員對(duì)RT-2模型進(jìn)行了和RT-1一樣的測試。結(jié)果顯示,RT-2的理解能力、推理能力、針對(duì)未知場景的泛化能力都顯著優(yōu)于RT-1模型。

可以說,基于大模型的AI技術(shù)讓人形機(jī)器人通用化變成了可能。而人形機(jī)器人作為一個(gè)硬件載體,也讓生成式AI距離AGI的目標(biāo)越來越近了。

/ 03 / 重新回到聚光燈下

盡管引入大模型后擁有了“常識(shí)”,并帶來了一定的泛化能力,解決了自然語言理解和任務(wù)規(guī)劃的兩大難題,也有越來越多公司發(fā)布人形機(jī)器人,似乎這一切離我們越來越近了。但我們必須清醒認(rèn)識(shí)到:人形機(jī)器人距離真正落地仍然有很長的路要走。

大模型對(duì)人形機(jī)器人智能化的突破固然可喜,但并不解決機(jī)器人硬件層面的難題。人形機(jī)器人的操作能力和移動(dòng)能力需要借助硬件本體的硬件和算法來實(shí)現(xiàn),但在過去50年的人形機(jī)器人研究歷程中,這個(gè)難關(guān)一直沒有被攻克。

比如,掃地機(jī)器人能通過底盤滑動(dòng)前行,四足機(jī)器狗可以靠四肢保持穩(wěn)定和平衡,但人形機(jī)器人只有兩條腿,行動(dòng)時(shí)只能依賴一條腿保證整個(gè)身體的穩(wěn)定和平衡。大模型對(duì)物理運(yùn)動(dòng)能力的幫助是有限的。

對(duì)于人形機(jī)器人公司來說,另一大挑戰(zhàn)是數(shù)據(jù)。人形機(jī)器人的模型訓(xùn)練需要大量決策數(shù)據(jù)做支撐,如果數(shù)據(jù)不夠,輸出的結(jié)果會(huì)容易漂移,成功率也會(huì)受影響。

目前,遙操作數(shù)據(jù)是各家機(jī)器人收集數(shù)據(jù)的重要方法,操作邏輯是先學(xué)習(xí)和分解人是怎么做到的,然后對(duì)應(yīng)機(jī)器人要怎么做到。由于采用的是真實(shí)世界數(shù)據(jù),數(shù)據(jù)質(zhì)量最高,但采集成本也很高。比如,谷歌用于訓(xùn)練 RT-1 和 RT-2 的機(jī)器人數(shù)據(jù)是歷時(shí)超過17個(gè)月在13個(gè)機(jī)器人上收集而來。當(dāng)年,OpenAI解散了旗下的機(jī)器人團(tuán)隊(duì),獲取收集難度大就是一個(gè)重要原因。

這也是大模型企業(yè)都在布局人形機(jī)器人的原因。借助機(jī)器人的硬件本體,AI可以更多的接觸外界信息,這些數(shù)據(jù)也有反哺AI算法的可能性。比如,特斯拉的自動(dòng)駕駛汽車在高速路上積累的數(shù)據(jù),哺育了 FSD 的算法系統(tǒng),提供了最基本的數(shù)據(jù)基礎(chǔ)。

盡管有著種種問題,但還是無法阻擋越來越多大模型公司沖入人形機(jī)器人賽道。很多人把去年稱為,人形機(jī)器人真正產(chǎn)業(yè)化的元年。但已經(jīng)少有人記得,2016年那波人形機(jī)器人熱潮,潮水褪去,最后活下來的所謂人形機(jī)器人公司寥寥無幾。

當(dāng)一項(xiàng)超出想象的新技術(shù)開始真正走向商業(yè)化,面世之初的震撼會(huì)很快消退。參與公司需要一邊接受商業(yè)規(guī)律的檢驗(yàn)、一邊推動(dòng)技術(shù)走向成熟。個(gè)人電腦、互聯(lián)網(wǎng)行業(yè)都經(jīng)受住這樣的考驗(yàn),進(jìn)而重塑了整個(gè)世界。人形機(jī)器人曾幾度突圍、幾度停滯,現(xiàn)在借著大模型的風(fēng)口,新一批公司又到了這個(gè)階段。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型這把“火”,燒到了人形機(jī)器人

人形機(jī)器人,正在重新回到熟悉的聚光燈下。

文|讀懂財(cái)經(jīng)

如果大模型是雷神之錘,那么適合它的釘子在哪?過去一年里,所有人都在急切地尋找這個(gè)問題的答案。人形機(jī)器人,可能是所有科技公司為數(shù)不多的一個(gè)共識(shí)。

近日,據(jù)外媒報(bào)道,微軟與OpenAI正洽談參與人形機(jī)器人公司Figure的新一輪融資,本輪融資金額最高可能達(dá)5億美元。

這已經(jīng)是OpenAI出手投資的第二家人形機(jī)器人公司。這并不是孤例。幾乎所有布局大模型的人和公司,都在研究人形機(jī)器人有著濃厚的熱情,并投入了研究資源。從英偉達(dá)到谷歌,從亞馬遜到Meta,甚至包括馬斯克,莫不是如此。

作為一個(gè)曾經(jīng)經(jīng)歷幾度起伏的高科技技術(shù),市場對(duì)人形機(jī)器人的熱情被AI 大模型徹底“點(diǎn)燃”。正如很多人預(yù)期的那樣,在在生成式AI通過AGI(人工通用智能)的道路上,人形機(jī)器人是不可或缺的重要硬件載體。

人形機(jī)器人,正在重新回到熟悉的聚光燈下。

/ 01 / 機(jī)器人熱情由來已久

此次投資Figure,并不是OpenAI第一次投資人形機(jī)器人公司。去年3月,來自挪威的人形機(jī)器人初創(chuàng)企業(yè) 1X Technologies(簡稱:1X),獲得了一輪由 OpenAI 創(chuàng)業(yè)基金領(lǐng)投的 2350 萬美元融資,成為了 OpenAI 投資的第一家硬件公司。

OpenAI的初創(chuàng)企業(yè)基金全稱是“OpenAI Startup Fund”,投資方向更側(cè)重于率先實(shí)現(xiàn)AI技術(shù)落地的方向。這也是OpenAI投資1X的重要邏輯。OpenAI一名高管曾公開表示,“投資1X瞄準(zhǔn)的時(shí)機(jī)是其機(jī)器人硬件已經(jīng)成熟,能夠在AI的加持下開拓更廣泛的勞動(dòng)力市場。”

如今,再次加注機(jī)器人賽道,說明OpenAI對(duì)人形機(jī)器人賽道的高度看好。作為人形機(jī)器人領(lǐng)域領(lǐng)先的創(chuàng)業(yè)公司,1X和Figure都已經(jīng)推出了人形機(jī)器人的產(chǎn)品。

其中,1X共有兩款機(jī)器人產(chǎn)品,工作機(jī)器人EVE和正在研發(fā)的家用雙足機(jī)器人NEO。而Figure也在去年發(fā)布了第一款通用人形機(jī)器人Figure 01,目前Figure已經(jīng)與寶馬達(dá)成協(xié)議,將在汽車制造領(lǐng)域部署“通用人形機(jī)器人”。

事實(shí)上,OpenAI對(duì)人形機(jī)器人的熱情由來已久,比大家想象得更高,甚至OpenAI還一度專門在內(nèi)部成立了一個(gè)機(jī)器人部門。

早在2017年,OpenAI的機(jī)器人團(tuán)隊(duì),就發(fā)布過用于模擬機(jī)器人控制的開源軟件Roboschool。2018年,團(tuán)隊(duì)研發(fā)出來的機(jī)械臂已經(jīng)能自如地“盤核桃”,即靈活把玩木塊。當(dāng)然,OpenAI機(jī)器人團(tuán)隊(duì)最著名的研究,是它研發(fā)的機(jī)械手,單手就能擰魔方:

當(dāng)然,對(duì)人形機(jī)器人情有獨(dú)鐘的大模型企業(yè)還不止OpenAI。一個(gè)有趣的現(xiàn)象是,幾乎每一個(gè)在大模型領(lǐng)域有所建樹的企業(yè),都或多或少地布局了人形機(jī)器人。

就拿谷歌來說,去年10月DeepMind發(fā)布RT-X機(jī)器人大模型,并開放訓(xùn)練數(shù)據(jù)集Open X-Embodiment。今年1月,谷歌DeepMind團(tuán)隊(duì)和斯坦福大學(xué)華人團(tuán)隊(duì)合作研發(fā)的能炒菜、做家務(wù)的通用機(jī)器人Mobile ALOHA刷屏全網(wǎng)。

至于馬斯克就更不用說,去年7月成立了一家名為X.Al的人工智能公司,今年年底,特斯拉推出了人形機(jī)器人擎天柱,并有望在明年實(shí)現(xiàn)交付。

AI大模型落地過程中,人形機(jī)器人究竟扮演著怎么角色,能夠受到這么多的青睞?

/ 02 / 人形機(jī)器人,AGI的“答案”?

在說大模型與人形機(jī)器人關(guān)系之前,我們需要先對(duì)什么是人形機(jī)器人有一個(gè)認(rèn)知。

必須明確一點(diǎn)的是,機(jī)器人并不是一個(gè)新興事物。在人形機(jī)器人出來之前,工業(yè)機(jī)器人已經(jīng)是一個(gè)超過500億的市場,并廣泛應(yīng)用于汽車、3C、紡織、包裝等行業(yè)。

但是工業(yè)機(jī)器人也有很明顯的弊端,就是通用性不足。傳統(tǒng)的工業(yè)機(jī)器人并不能直接使用,需要被系統(tǒng)集成商集成后使用。機(jī)器人的系統(tǒng)集成不僅需要結(jié)合對(duì)客戶工藝的理解高度定制,同時(shí)也是嚴(yán)重依賴工程師的經(jīng)驗(yàn)。這注定了工業(yè)機(jī)器人適用于大規(guī)模、重復(fù)性生產(chǎn)的工作。

與其說,工業(yè)機(jī)器人是機(jī)器人,倒不如說其更像是自動(dòng)化設(shè)備。在這一點(diǎn)上,人形機(jī)器人無疑更接近我們對(duì)機(jī)器人的理解。

人形機(jī)器人,顧名思義就是形態(tài)更接近人的機(jī)器人。但外在的形態(tài)不過是表象,其內(nèi)核的特點(diǎn)是機(jī)器人的智能性和通用性。之所以選擇“人形”,只是因?yàn)槲覀兓顒?dòng)的世界是為人的身體所創(chuàng)造的,人的形態(tài)可以操作一切工具,具有最廣泛的適應(yīng)性。

從物理維度上說,人形機(jī)器人由三個(gè)模塊組成,分別是“肢體”“小腦”和“大腦”,其中“肢體”由靈巧手、傳感器等一系列硬件組成,“小腦”負(fù)責(zé)運(yùn)動(dòng)控制,“大腦”則主導(dǎo)機(jī)器人的環(huán)境感知、推理決策和語言交互。

而大模型的出現(xiàn),將語義理解能力和推理生成能力引入其中,相當(dāng)于給人形機(jī)器人換了個(gè)“大腦”。 大模型對(duì)人形機(jī)器人的提升主要體現(xiàn)在兩個(gè)方面:感知能力和思考決策能力。

先說感知能力,大模型的強(qiáng)擬合能力使得人形機(jī)器人在進(jìn)行目標(biāo)識(shí)別、避障、三維重建、語義分割等任務(wù)時(shí)有可能實(shí)現(xiàn)更高的高精確度。舉個(gè)例子,現(xiàn)在AI已經(jīng)可以做到識(shí)別障礙物,但是如果路邊有個(gè)人舉個(gè)牌子,說前方橋斷請(qǐng)繞行。過去的AI很難理解這種情況,但基于大模型的人形機(jī)器人卻有可能識(shí)別、理解這些信息。

思考決策能力的意思是,人形機(jī)器人具備較好的知識(shí)完備性,能夠把一個(gè)指令拆解成多個(gè)子任務(wù)和子指令,在不同場景去完成各種任務(wù)。比方說,你和機(jī)器人說“把飯熱一下”,它知道要去找微波爐。

隨著谷歌、英偉達(dá)等公司對(duì)大模型+機(jī)器人探索的深入,上述積極影響也得到了證實(shí)。2022 年 12 月,谷歌發(fā)布了RT-1模型。這是一個(gè)基于機(jī)器人數(shù)據(jù)的端到端模型,輸入端是一小段圖像序列和用文本描述的任務(wù),輸出端是動(dòng)作指令,包括7個(gè)維度的手臂動(dòng)作指令、3個(gè)維度的基礎(chǔ)移動(dòng)指令和1個(gè)維度的狀態(tài)切換指令。

研究人員讓機(jī)器人執(zhí)行了超過 700 項(xiàng)任務(wù),結(jié)果顯示:在之前見過的場景、之前未見過的場景、被干擾場景、背景更換場景,搭載 RT-1 模型的機(jī)器人都展現(xiàn)出了更高的成功率。

值得一提的是,這是機(jī)器人首次通過龐大的、多樣化的、任務(wù)無關(guān)的數(shù)據(jù),展現(xiàn)出泛化性,執(zhí)行了一些未曾見過的任務(wù)。

去年7月,谷歌發(fā)布了RT-2,這是一個(gè)視覺—語言—?jiǎng)幼髂P?。在這個(gè)模型里,谷歌將參數(shù)量從35M提高到55B。研究人員對(duì)RT-2模型進(jìn)行了和RT-1一樣的測試。結(jié)果顯示,RT-2的理解能力、推理能力、針對(duì)未知場景的泛化能力都顯著優(yōu)于RT-1模型。

可以說,基于大模型的AI技術(shù)讓人形機(jī)器人通用化變成了可能。而人形機(jī)器人作為一個(gè)硬件載體,也讓生成式AI距離AGI的目標(biāo)越來越近了。

/ 03 / 重新回到聚光燈下

盡管引入大模型后擁有了“常識(shí)”,并帶來了一定的泛化能力,解決了自然語言理解和任務(wù)規(guī)劃的兩大難題,也有越來越多公司發(fā)布人形機(jī)器人,似乎這一切離我們越來越近了。但我們必須清醒認(rèn)識(shí)到:人形機(jī)器人距離真正落地仍然有很長的路要走。

大模型對(duì)人形機(jī)器人智能化的突破固然可喜,但并不解決機(jī)器人硬件層面的難題。人形機(jī)器人的操作能力和移動(dòng)能力需要借助硬件本體的硬件和算法來實(shí)現(xiàn),但在過去50年的人形機(jī)器人研究歷程中,這個(gè)難關(guān)一直沒有被攻克。

比如,掃地機(jī)器人能通過底盤滑動(dòng)前行,四足機(jī)器狗可以靠四肢保持穩(wěn)定和平衡,但人形機(jī)器人只有兩條腿,行動(dòng)時(shí)只能依賴一條腿保證整個(gè)身體的穩(wěn)定和平衡。大模型對(duì)物理運(yùn)動(dòng)能力的幫助是有限的。

對(duì)于人形機(jī)器人公司來說,另一大挑戰(zhàn)是數(shù)據(jù)。人形機(jī)器人的模型訓(xùn)練需要大量決策數(shù)據(jù)做支撐,如果數(shù)據(jù)不夠,輸出的結(jié)果會(huì)容易漂移,成功率也會(huì)受影響。

目前,遙操作數(shù)據(jù)是各家機(jī)器人收集數(shù)據(jù)的重要方法,操作邏輯是先學(xué)習(xí)和分解人是怎么做到的,然后對(duì)應(yīng)機(jī)器人要怎么做到。由于采用的是真實(shí)世界數(shù)據(jù),數(shù)據(jù)質(zhì)量最高,但采集成本也很高。比如,谷歌用于訓(xùn)練 RT-1 和 RT-2 的機(jī)器人數(shù)據(jù)是歷時(shí)超過17個(gè)月在13個(gè)機(jī)器人上收集而來。當(dāng)年,OpenAI解散了旗下的機(jī)器人團(tuán)隊(duì),獲取收集難度大就是一個(gè)重要原因。

這也是大模型企業(yè)都在布局人形機(jī)器人的原因。借助機(jī)器人的硬件本體,AI可以更多的接觸外界信息,這些數(shù)據(jù)也有反哺AI算法的可能性。比如,特斯拉的自動(dòng)駕駛汽車在高速路上積累的數(shù)據(jù),哺育了 FSD 的算法系統(tǒng),提供了最基本的數(shù)據(jù)基礎(chǔ)。

盡管有著種種問題,但還是無法阻擋越來越多大模型公司沖入人形機(jī)器人賽道。很多人把去年稱為,人形機(jī)器人真正產(chǎn)業(yè)化的元年。但已經(jīng)少有人記得,2016年那波人形機(jī)器人熱潮,潮水褪去,最后活下來的所謂人形機(jī)器人公司寥寥無幾。

當(dāng)一項(xiàng)超出想象的新技術(shù)開始真正走向商業(yè)化,面世之初的震撼會(huì)很快消退。參與公司需要一邊接受商業(yè)規(guī)律的檢驗(yàn)、一邊推動(dòng)技術(shù)走向成熟。個(gè)人電腦、互聯(lián)網(wǎng)行業(yè)都經(jīng)受住這樣的考驗(yàn),進(jìn)而重塑了整個(gè)世界。人形機(jī)器人曾幾度突圍、幾度停滯,現(xiàn)在借著大模型的風(fēng)口,新一批公司又到了這個(gè)階段。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。