正在閱讀:

人形機(jī)器人以后“論斤賣” ?

掃一掃下載界面新聞APP

人形機(jī)器人以后“論斤賣” ?

5~10年將有大突破,商業(yè)落地蓄勢待發(fā)。

文| IT時報記者 沈毅斌

編輯|孫妍

“桌面有點亂,你幫忙清理一下?!?/p>

“好的,正在為您清理桌面。”

聽到指令后,“青龍”一邊回答一邊緩緩抬起雙臂,用雙手緩慢且輕柔地抓起桌面上混合擺放的面包和水果,分類放進(jìn)左右兩個籃筐內(nèi),即使是柔軟的面包,也不會變形。在人形機(jī)器人與具身智能發(fā)展論壇上展示的這款“青龍”人形智能機(jī)器人不僅擁有識別認(rèn)知能力,185厘米的身高和80公斤的體重,放在機(jī)器人界也是妥妥的“型男”一枚。

從國內(nèi)外眾多機(jī)器人企業(yè)“大秀肌肉”展出的“十八金剛”,到各種論壇暢想著機(jī)器人的發(fā)展前景,人形機(jī)器人、具身智能成為2024世界人工智能大會(WAIC 2024)當(dāng)之無愧的“頂流”。主辦方數(shù)據(jù)顯示,本屆大會合計展出的人形機(jī)器人超過25款。火熱的人形機(jī)器人賽道,正在迎來商業(yè)化蝶變的關(guān)鍵時刻。

但冷靜下來思考,人形機(jī)器人的發(fā)展依舊面臨諸多挑戰(zhàn),上海人形機(jī)器人制造業(yè)創(chuàng)新中心首席科學(xué)家江磊表示,人形機(jī)器人當(dāng)前面臨的問題可以總結(jié)為“一高五難”,硬件門檻高、軟件算法難、軟硬解耦難、知識積累難、人才聚集難、安全應(yīng)用難。

人形機(jī)器人與具身智能目前發(fā)展現(xiàn)狀如何?何時能夠商業(yè)化落地?怎樣讓人形機(jī)器人遵循“機(jī)器人三大定律”?帶著這些問題,走進(jìn)WAIC 2024的人形機(jī)器人“世界”。

人形機(jī)器人應(yīng)該“論斤賣”

人形機(jī)器人由控制器、傳感器、精密減速器、交流伺服電機(jī)等核心零部件組成,每一個部件都需要不菲的成本。

根據(jù)Macquarie Research在2023年發(fā)布的報告,人形機(jī)器人的硬件總成本目前約為5萬美元。其中,端到端AI軟件大腦、傳感器與芯片、伺服電機(jī)與電機(jī)驅(qū)動器都各需要1萬美元,慣性測量單元與扭矩傳感器需要5000美元,精密減速器需要8000美元,電池與電池控制系統(tǒng)需要2000美元,其他部件約5000美元。

以色列智能機(jī)器人中心主席Yosi Lahad在人形機(jī)器人前沿論壇上表示,為了讓人形機(jī)器人能夠得到大規(guī)模采用,其成本需要降到2萬美元以下,是現(xiàn)在成本的一半以下,甚至可能需要對機(jī)器人的外型進(jìn)行一些改變,例如重新考慮模仿人類腿部的底座設(shè)計。而特斯拉預(yù)計明年量產(chǎn)的Optimus,預(yù)計成本控制在1萬美元左右,預(yù)計售價2萬美元。

相比之下,國內(nèi)人形機(jī)器人已經(jīng)將售價降至10萬元以下,今年5月,宇樹科技發(fā)布的最新的人形機(jī)器人產(chǎn)品Unitree G1,市場售價僅9.9萬元起?!拔覀円恢闭J(rèn)為,人形機(jī)器人未來應(yīng)該像豬肉一樣論斤賣。”宇樹科技聯(lián)合創(chuàng)始人陳立在“國際人形機(jī)器人技術(shù)與應(yīng)用發(fā)展論壇”上表示,拋開研發(fā)成本,人形機(jī)器人其實是鐵、鋼、銅等材料的堆疊,隨著零部件的量產(chǎn),成本自然也會隨之降低。

根據(jù)《2024年中國人形機(jī)器人行業(yè)研究報告》,人形機(jī)器人按量產(chǎn)規(guī)模不同,降本大致可劃分為三個階段:小批量千臺量級生產(chǎn),降本20%~30%至約10萬美元;萬臺級別降本50%至5萬美元;數(shù)十萬至百萬臺大規(guī)模量產(chǎn),降本70%~80%至2萬~3萬美元。一時間,人們感到人形機(jī)器人商業(yè)落地近在咫尺。

但需要注意的是,Unitree G1與Optimus的區(qū)別在于沒有搭載大模型,若按照智能標(biāo)準(zhǔn)來看,特斯拉的Optimus依舊可以作為行業(yè)的風(fēng)向標(biāo)之一。

成本不僅來自硬件

硬件是人形機(jī)器人最直觀的成本,但在降低成本方面不能只依賴于硬件的量產(chǎn)。

“硬件成本降低我認(rèn)為已經(jīng)不是主要難題,而是時間問題,設(shè)計和研發(fā)環(huán)節(jié)的成本才是人形機(jī)器人目前需要突破的成本問題。”聚焦國訊芯微董事長方婷婷在論壇上表示,國內(nèi)人形機(jī)器人領(lǐng)域有許多核心技術(shù)依賴國外進(jìn)口,如人形機(jī)器人仿真工具平臺。

從人形機(jī)器人軟件形態(tài)來說,大量的跨學(xué)科內(nèi)容都需要軟件來融合,需要更多的相關(guān)產(chǎn)業(yè)企業(yè)來抱團(tuán)。而人形機(jī)器人本體廠商也要從設(shè)計之初就考慮軟硬件成本。

鑫精誠傳感器董事長吳浩認(rèn)為集成化也是降低人形機(jī)器人成本的方式之一,比如在靈巧手方面,人類的手指可以感受溫度、力度等,人形機(jī)器人的傳感器也可以借鑒,將多模態(tài)的感受集成在同一零部件上,這樣既能降低成本,也能減少體積。

人形機(jī)器人會在哪些應(yīng)用場景爆發(fā)?B端場景下,開普勒CEO胡德波認(rèn)為,第一類是工業(yè)場景,尤其是重工業(yè),工人的安全得不到保障,用人成本高,適合用人形機(jī)器人替代;第二類是倉儲物流場景,可能是最快實現(xiàn)落地的場景之一;第三類是制造業(yè),如3C制造、汽車制造等。業(yè)內(nèi)人士對C端場景的應(yīng)用已經(jīng)達(dá)成共識,人形機(jī)器人將走進(jìn)千家萬戶,賦能養(yǎng)老育兒場景。

據(jù)高盛最新預(yù)測,人形機(jī)器人到2035年將呈爆發(fā)式增長,出貨量將達(dá)到140萬臺,全球市場總規(guī)模(TAM)達(dá)380億美元。全球從事物流和制造業(yè)的人形機(jī)器人將在2030年左右達(dá)到100萬臺,人形機(jī)器人有望在十年內(nèi)走入服務(wù)、家庭護(hù)理、健康和教育產(chǎn)業(yè)。

5~10年迎來大突破

如今的人工智能如同一顆封在瓶子中的“大腦”,雖然會計算、思考,卻不能付諸行動。具身智能是一種智能系統(tǒng)或機(jī)器通過感知交互與環(huán)境進(jìn)行實時互動的能力,通俗的理解是為人工智能打造一款可操控的身體,包括四足機(jī)器狗、工業(yè)機(jī)器人、動物仿生機(jī)器人、自動駕駛汽車等多種形態(tài),但人形機(jī)器人的類人形態(tài),可以更貼合人們的互動需求,無疑是具身智能的最佳載體。

中國工程院外籍院士張建偉在人形機(jī)器人與具身智能發(fā)展論壇上表示,實現(xiàn)具身智能需要完成三個維度的突破,即空間維度,在開放式、復(fù)雜、動態(tài)的空間環(huán)境下,實現(xiàn)二維、三維動態(tài)語義建模;時間維度,除了簡單移動外,還要同時具備操作和使用工具的能力;交互能力,讓機(jī)器人基于知識和人、環(huán)境做出正確的交互行為。這其中依賴的便是AI大模型。

僅靠大模型進(jìn)行感知、策劃還不能讓具身實現(xiàn)真正智能,加入“小腦”才能進(jìn)行動作執(zhí)行。

以“青龍”為例,名為“朱雀”的具身大腦以多模態(tài)大模型為核心,通過文字信息、圖像信息作為輸入,輸出語音交互以及任務(wù)決策信息?!靶洹毙∧X模型則是具體任務(wù)執(zhí)行模型,軌跡規(guī)劃模塊由端到端模仿學(xué)習(xí)所驅(qū)動,以人類的作業(yè)作為模仿對象,進(jìn)行機(jī)載視覺輸入,并輸出人們所期待的行動軌跡。運動控制器則基于強(qiáng)化學(xué)習(xí)的智能運動控制方法和全身動力學(xué)的模型預(yù)測控制方法兩條技術(shù)路徑,通過環(huán)境信息以及機(jī)器人的狀態(tài),完成任務(wù)執(zhí)行。

盡管AI大模型開始“移植”到具身智能上,但效果并不算理想?!扒帻垺睓C(jī)器人平臺技術(shù)負(fù)責(zé)人梁振杰坦言,目前,模型還處于發(fā)展的初期階段,功能尚不完善,能力仍需提升。

宇樹科技CEO王興興在論壇中表示,目前大語言模型、多模態(tài)模型對整個世界的理解其實是非常糟糕的,包括時間、時空、物理定律等方面的理解。世界模型+具身智能才是通向AGI的最佳路徑。

上海人工智能實驗室主任、首席科學(xué)家周伯文也認(rèn)為,具身智能不只是大模型加機(jī)器人的應(yīng)用,而是需要根據(jù)物理世界的反饋及時進(jìn)化的大模型。

不過,對于人形機(jī)器人和具身智能未來的發(fā)展,業(yè)內(nèi)依舊持積極開放態(tài)度?!拔磥?年肯定有很大的技術(shù)突破,絕對不會超過10年?!蓖跖d興預(yù)測道。國家地方共建人形機(jī)器人創(chuàng)新中心總經(jīng)理許彬也表示,會把相關(guān)的人形機(jī)器人的全棧技術(shù),包括大腦、小腦、肢體的相關(guān)技術(shù)全部開源。通過5年~10年,在人類的家政服務(wù)、交流陪護(hù)領(lǐng)域進(jìn)行更多應(yīng)用。

規(guī)?;瘮?shù)據(jù)是最大痛點

數(shù)據(jù)無論是對人工智能,還是具身智能而言,都是靈魂般的存在。目前,人形機(jī)器人主要數(shù)據(jù)來源是國外的開源數(shù)據(jù),以及研發(fā)機(jī)構(gòu)通過動作捕捉、視覺捕捉等方式自行采集。

但自行采集往往需要大量的人力成本,去不斷模擬演示。北京大學(xué)助理教授、銀河具身智能聯(lián)合實驗室主任王鶴在人形機(jī)器人與具身智能發(fā)展論壇上舉例道,把電池放到盒子里這樣一個對于人類而言十分簡單的動作,特斯拉靠40人的采集團(tuán)隊進(jìn)行遙操實現(xiàn),每一個傾斜、橫倒、錯位等所有失效案例都要采集。

“人形機(jī)器人規(guī)?;瘮?shù)據(jù)是整個行業(yè)目前最大的痛點?!眹业胤焦步ㄈ诵螜C(jī)器人創(chuàng)新中心研發(fā)體系總監(jiān)邢伯陽也同樣表示。

面對這一行業(yè)痛點,王鶴認(rèn)為當(dāng)下可以真正實現(xiàn)規(guī)?;慨a(chǎn)的數(shù)據(jù)就是合成數(shù)據(jù)。所謂合成數(shù)據(jù),是一種通過算法生成的數(shù)據(jù),雖與真實數(shù)據(jù)相似,卻并不直接來源于真實世界。

靠合成數(shù)據(jù)具身智能實現(xiàn)了從0到1的突破。在銀河通用機(jī)器人訓(xùn)練時發(fā)現(xiàn),二維傳感器存在泛化問題,跳脫出訓(xùn)練數(shù)據(jù)便不會處理;三維傳感器又無法識別玻璃等透明物體。最終,靠合成數(shù)據(jù)進(jìn)行千萬場景十億抓取的大規(guī)模訓(xùn)練,才實現(xiàn)銀河通用機(jī)器人對各種物體的任意抓取。

邢伯陽代表的國家地方共建人形機(jī)器人創(chuàng)新中心則主張通過數(shù)據(jù)開源的方式來共享海量數(shù)據(jù)。為此打造出Openloong開源社區(qū),通過社區(qū)和訓(xùn)練場創(chuàng)新的機(jī)制加速人形機(jī)器人、具身智能訓(xùn)練和數(shù)據(jù)集構(gòu)建的工作。

不發(fā)展是最大的不安全

人形機(jī)器人已不再是科幻小說中的幻想,而是融入日常生活的現(xiàn)實。試想一下,未來人形機(jī)器人穿梭于繁華都市的大街小巷,在工廠、醫(yī)院等地按照系統(tǒng)指令按部就班,這將改變?nèi)藗兊纳罘绞胶蜕鐣Y(jié)構(gòu)。而與這一科技進(jìn)步相伴而來的,是關(guān)于人形機(jī)器人治理的思考與挑戰(zhàn)。

“高鐵剛進(jìn)入中國時,許多人擔(dān)心電磁波輻射;早期飛機(jī)、電話等發(fā)明同樣被人們所擔(dān)憂??梢哉f人類的進(jìn)步史就是對科技發(fā)展的擔(dān)憂史。我們應(yīng)該制定一部促進(jìn)人工智能發(fā)展的法律,而不是一部規(guī)范人工智能行為的法律。”在人形機(jī)器人法治與倫理論壇上中國政法大學(xué)副校長時建中表示,面對擔(dān)憂不應(yīng)過度焦慮,要對人工智能采取包容和審慎態(tài)度,這體現(xiàn)在訓(xùn)練數(shù)據(jù)易獲取、算力與算法鼓勵合作、生成內(nèi)容容錯并及時糾錯等方面。

聯(lián)合國人工智能高級別咨詢機(jī)構(gòu)成員、中國政法大學(xué)數(shù)據(jù)法治研究院教授張凌寒同樣表示,不發(fā)展是最大的不安全,要全力促進(jìn)人工智能的發(fā)展。

“它就像一歲半大的孩子,需要我們的正確引導(dǎo)?!比A東師范大學(xué)人工智能金融學(xué)院院長、教授邵怡蕾表示,目前,人形機(jī)器人在人工智能的加持下已經(jīng)具備感知智能和認(rèn)知智能,最后一座需要攻克的“堡壘”是行為智能。而當(dāng)人形機(jī)器人行為出現(xiàn)在人類社會后,是對人類身份與法律的挑戰(zhàn),這不僅需要對人形機(jī)器人進(jìn)行身份界定,更需要人類對其行為進(jìn)行引導(dǎo)和約束。

如何協(xié)調(diào)機(jī)器人與人類之間的互動?阿西莫夫的“機(jī)器人三定律”曾經(jīng)被視為基礎(chǔ)規(guī)范。但是,當(dāng)具身智能時代來臨之際,這樣的“約法三章”已經(jīng)難以解決人機(jī)共生的復(fù)雜問題,需要一種新的法律治理架構(gòu)。

中國海洋大學(xué)法學(xué)院教授李晟在《東方法學(xué)》人形機(jī)器人法治??斜硎?,治理架構(gòu)需要立足于人形機(jī)器人與人的差距,考慮當(dāng)前發(fā)展階段的應(yīng)用問題,而不是關(guān)注人形機(jī)器人替代人時所產(chǎn)生的未來問題。

排版/ 季嘉穎

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

人形機(jī)器人以后“論斤賣” ?

5~10年將有大突破,商業(yè)落地蓄勢待發(fā)。

文| IT時報記者 沈毅斌

編輯|孫妍

“桌面有點亂,你幫忙清理一下。”

“好的,正在為您清理桌面。”

聽到指令后,“青龍”一邊回答一邊緩緩抬起雙臂,用雙手緩慢且輕柔地抓起桌面上混合擺放的面包和水果,分類放進(jìn)左右兩個籃筐內(nèi),即使是柔軟的面包,也不會變形。在人形機(jī)器人與具身智能發(fā)展論壇上展示的這款“青龍”人形智能機(jī)器人不僅擁有識別認(rèn)知能力,185厘米的身高和80公斤的體重,放在機(jī)器人界也是妥妥的“型男”一枚。

從國內(nèi)外眾多機(jī)器人企業(yè)“大秀肌肉”展出的“十八金剛”,到各種論壇暢想著機(jī)器人的發(fā)展前景,人形機(jī)器人、具身智能成為2024世界人工智能大會(WAIC 2024)當(dāng)之無愧的“頂流”。主辦方數(shù)據(jù)顯示,本屆大會合計展出的人形機(jī)器人超過25款?;馃岬娜诵螜C(jī)器人賽道,正在迎來商業(yè)化蝶變的關(guān)鍵時刻。

但冷靜下來思考,人形機(jī)器人的發(fā)展依舊面臨諸多挑戰(zhàn),上海人形機(jī)器人制造業(yè)創(chuàng)新中心首席科學(xué)家江磊表示,人形機(jī)器人當(dāng)前面臨的問題可以總結(jié)為“一高五難”,硬件門檻高、軟件算法難、軟硬解耦難、知識積累難、人才聚集難、安全應(yīng)用難。

人形機(jī)器人與具身智能目前發(fā)展現(xiàn)狀如何?何時能夠商業(yè)化落地?怎樣讓人形機(jī)器人遵循“機(jī)器人三大定律”?帶著這些問題,走進(jìn)WAIC 2024的人形機(jī)器人“世界”。

人形機(jī)器人應(yīng)該“論斤賣”

人形機(jī)器人由控制器、傳感器、精密減速器、交流伺服電機(jī)等核心零部件組成,每一個部件都需要不菲的成本。

根據(jù)Macquarie Research在2023年發(fā)布的報告,人形機(jī)器人的硬件總成本目前約為5萬美元。其中,端到端AI軟件大腦、傳感器與芯片、伺服電機(jī)與電機(jī)驅(qū)動器都各需要1萬美元,慣性測量單元與扭矩傳感器需要5000美元,精密減速器需要8000美元,電池與電池控制系統(tǒng)需要2000美元,其他部件約5000美元。

以色列智能機(jī)器人中心主席Yosi Lahad在人形機(jī)器人前沿論壇上表示,為了讓人形機(jī)器人能夠得到大規(guī)模采用,其成本需要降到2萬美元以下,是現(xiàn)在成本的一半以下,甚至可能需要對機(jī)器人的外型進(jìn)行一些改變,例如重新考慮模仿人類腿部的底座設(shè)計。而特斯拉預(yù)計明年量產(chǎn)的Optimus,預(yù)計成本控制在1萬美元左右,預(yù)計售價2萬美元。

相比之下,國內(nèi)人形機(jī)器人已經(jīng)將售價降至10萬元以下,今年5月,宇樹科技發(fā)布的最新的人形機(jī)器人產(chǎn)品Unitree G1,市場售價僅9.9萬元起?!拔覀円恢闭J(rèn)為,人形機(jī)器人未來應(yīng)該像豬肉一樣論斤賣?!庇顦淇萍悸?lián)合創(chuàng)始人陳立在“國際人形機(jī)器人技術(shù)與應(yīng)用發(fā)展論壇”上表示,拋開研發(fā)成本,人形機(jī)器人其實是鐵、鋼、銅等材料的堆疊,隨著零部件的量產(chǎn),成本自然也會隨之降低。

根據(jù)《2024年中國人形機(jī)器人行業(yè)研究報告》,人形機(jī)器人按量產(chǎn)規(guī)模不同,降本大致可劃分為三個階段:小批量千臺量級生產(chǎn),降本20%~30%至約10萬美元;萬臺級別降本50%至5萬美元;數(shù)十萬至百萬臺大規(guī)模量產(chǎn),降本70%~80%至2萬~3萬美元。一時間,人們感到人形機(jī)器人商業(yè)落地近在咫尺。

但需要注意的是,Unitree G1與Optimus的區(qū)別在于沒有搭載大模型,若按照智能標(biāo)準(zhǔn)來看,特斯拉的Optimus依舊可以作為行業(yè)的風(fēng)向標(biāo)之一。

成本不僅來自硬件

硬件是人形機(jī)器人最直觀的成本,但在降低成本方面不能只依賴于硬件的量產(chǎn)。

“硬件成本降低我認(rèn)為已經(jīng)不是主要難題,而是時間問題,設(shè)計和研發(fā)環(huán)節(jié)的成本才是人形機(jī)器人目前需要突破的成本問題?!本劢箛嵭疚⒍麻L方婷婷在論壇上表示,國內(nèi)人形機(jī)器人領(lǐng)域有許多核心技術(shù)依賴國外進(jìn)口,如人形機(jī)器人仿真工具平臺。

從人形機(jī)器人軟件形態(tài)來說,大量的跨學(xué)科內(nèi)容都需要軟件來融合,需要更多的相關(guān)產(chǎn)業(yè)企業(yè)來抱團(tuán)。而人形機(jī)器人本體廠商也要從設(shè)計之初就考慮軟硬件成本。

鑫精誠傳感器董事長吳浩認(rèn)為集成化也是降低人形機(jī)器人成本的方式之一,比如在靈巧手方面,人類的手指可以感受溫度、力度等,人形機(jī)器人的傳感器也可以借鑒,將多模態(tài)的感受集成在同一零部件上,這樣既能降低成本,也能減少體積。

人形機(jī)器人會在哪些應(yīng)用場景爆發(fā)?B端場景下,開普勒CEO胡德波認(rèn)為,第一類是工業(yè)場景,尤其是重工業(yè),工人的安全得不到保障,用人成本高,適合用人形機(jī)器人替代;第二類是倉儲物流場景,可能是最快實現(xiàn)落地的場景之一;第三類是制造業(yè),如3C制造、汽車制造等。業(yè)內(nèi)人士對C端場景的應(yīng)用已經(jīng)達(dá)成共識,人形機(jī)器人將走進(jìn)千家萬戶,賦能養(yǎng)老育兒場景。

據(jù)高盛最新預(yù)測,人形機(jī)器人到2035年將呈爆發(fā)式增長,出貨量將達(dá)到140萬臺,全球市場總規(guī)模(TAM)達(dá)380億美元。全球從事物流和制造業(yè)的人形機(jī)器人將在2030年左右達(dá)到100萬臺,人形機(jī)器人有望在十年內(nèi)走入服務(wù)、家庭護(hù)理、健康和教育產(chǎn)業(yè)。

5~10年迎來大突破

如今的人工智能如同一顆封在瓶子中的“大腦”,雖然會計算、思考,卻不能付諸行動。具身智能是一種智能系統(tǒng)或機(jī)器通過感知交互與環(huán)境進(jìn)行實時互動的能力,通俗的理解是為人工智能打造一款可操控的身體,包括四足機(jī)器狗、工業(yè)機(jī)器人、動物仿生機(jī)器人、自動駕駛汽車等多種形態(tài),但人形機(jī)器人的類人形態(tài),可以更貼合人們的互動需求,無疑是具身智能的最佳載體。

中國工程院外籍院士張建偉在人形機(jī)器人與具身智能發(fā)展論壇上表示,實現(xiàn)具身智能需要完成三個維度的突破,即空間維度,在開放式、復(fù)雜、動態(tài)的空間環(huán)境下,實現(xiàn)二維、三維動態(tài)語義建模;時間維度,除了簡單移動外,還要同時具備操作和使用工具的能力;交互能力,讓機(jī)器人基于知識和人、環(huán)境做出正確的交互行為。這其中依賴的便是AI大模型。

僅靠大模型進(jìn)行感知、策劃還不能讓具身實現(xiàn)真正智能,加入“小腦”才能進(jìn)行動作執(zhí)行。

以“青龍”為例,名為“朱雀”的具身大腦以多模態(tài)大模型為核心,通過文字信息、圖像信息作為輸入,輸出語音交互以及任務(wù)決策信息。“玄武”小腦模型則是具體任務(wù)執(zhí)行模型,軌跡規(guī)劃模塊由端到端模仿學(xué)習(xí)所驅(qū)動,以人類的作業(yè)作為模仿對象,進(jìn)行機(jī)載視覺輸入,并輸出人們所期待的行動軌跡。運動控制器則基于強(qiáng)化學(xué)習(xí)的智能運動控制方法和全身動力學(xué)的模型預(yù)測控制方法兩條技術(shù)路徑,通過環(huán)境信息以及機(jī)器人的狀態(tài),完成任務(wù)執(zhí)行。

盡管AI大模型開始“移植”到具身智能上,但效果并不算理想?!扒帻垺睓C(jī)器人平臺技術(shù)負(fù)責(zé)人梁振杰坦言,目前,模型還處于發(fā)展的初期階段,功能尚不完善,能力仍需提升。

宇樹科技CEO王興興在論壇中表示,目前大語言模型、多模態(tài)模型對整個世界的理解其實是非常糟糕的,包括時間、時空、物理定律等方面的理解。世界模型+具身智能才是通向AGI的最佳路徑。

上海人工智能實驗室主任、首席科學(xué)家周伯文也認(rèn)為,具身智能不只是大模型加機(jī)器人的應(yīng)用,而是需要根據(jù)物理世界的反饋及時進(jìn)化的大模型。

不過,對于人形機(jī)器人和具身智能未來的發(fā)展,業(yè)內(nèi)依舊持積極開放態(tài)度。“未來5年肯定有很大的技術(shù)突破,絕對不會超過10年?!蓖跖d興預(yù)測道。國家地方共建人形機(jī)器人創(chuàng)新中心總經(jīng)理許彬也表示,會把相關(guān)的人形機(jī)器人的全棧技術(shù),包括大腦、小腦、肢體的相關(guān)技術(shù)全部開源。通過5年~10年,在人類的家政服務(wù)、交流陪護(hù)領(lǐng)域進(jìn)行更多應(yīng)用。

規(guī)?;瘮?shù)據(jù)是最大痛點

數(shù)據(jù)無論是對人工智能,還是具身智能而言,都是靈魂般的存在。目前,人形機(jī)器人主要數(shù)據(jù)來源是國外的開源數(shù)據(jù),以及研發(fā)機(jī)構(gòu)通過動作捕捉、視覺捕捉等方式自行采集。

但自行采集往往需要大量的人力成本,去不斷模擬演示。北京大學(xué)助理教授、銀河具身智能聯(lián)合實驗室主任王鶴在人形機(jī)器人與具身智能發(fā)展論壇上舉例道,把電池放到盒子里這樣一個對于人類而言十分簡單的動作,特斯拉靠40人的采集團(tuán)隊進(jìn)行遙操實現(xiàn),每一個傾斜、橫倒、錯位等所有失效案例都要采集。

“人形機(jī)器人規(guī)?;瘮?shù)據(jù)是整個行業(yè)目前最大的痛點?!眹业胤焦步ㄈ诵螜C(jī)器人創(chuàng)新中心研發(fā)體系總監(jiān)邢伯陽也同樣表示。

面對這一行業(yè)痛點,王鶴認(rèn)為當(dāng)下可以真正實現(xiàn)規(guī)模化量產(chǎn)的數(shù)據(jù)就是合成數(shù)據(jù)。所謂合成數(shù)據(jù),是一種通過算法生成的數(shù)據(jù),雖與真實數(shù)據(jù)相似,卻并不直接來源于真實世界。

靠合成數(shù)據(jù)具身智能實現(xiàn)了從0到1的突破。在銀河通用機(jī)器人訓(xùn)練時發(fā)現(xiàn),二維傳感器存在泛化問題,跳脫出訓(xùn)練數(shù)據(jù)便不會處理;三維傳感器又無法識別玻璃等透明物體。最終,靠合成數(shù)據(jù)進(jìn)行千萬場景十億抓取的大規(guī)模訓(xùn)練,才實現(xiàn)銀河通用機(jī)器人對各種物體的任意抓取。

邢伯陽代表的國家地方共建人形機(jī)器人創(chuàng)新中心則主張通過數(shù)據(jù)開源的方式來共享海量數(shù)據(jù)。為此打造出Openloong開源社區(qū),通過社區(qū)和訓(xùn)練場創(chuàng)新的機(jī)制加速人形機(jī)器人、具身智能訓(xùn)練和數(shù)據(jù)集構(gòu)建的工作。

不發(fā)展是最大的不安全

人形機(jī)器人已不再是科幻小說中的幻想,而是融入日常生活的現(xiàn)實。試想一下,未來人形機(jī)器人穿梭于繁華都市的大街小巷,在工廠、醫(yī)院等地按照系統(tǒng)指令按部就班,這將改變?nèi)藗兊纳罘绞胶蜕鐣Y(jié)構(gòu)。而與這一科技進(jìn)步相伴而來的,是關(guān)于人形機(jī)器人治理的思考與挑戰(zhàn)。

“高鐵剛進(jìn)入中國時,許多人擔(dān)心電磁波輻射;早期飛機(jī)、電話等發(fā)明同樣被人們所擔(dān)憂??梢哉f人類的進(jìn)步史就是對科技發(fā)展的擔(dān)憂史。我們應(yīng)該制定一部促進(jìn)人工智能發(fā)展的法律,而不是一部規(guī)范人工智能行為的法律?!痹谌诵螜C(jī)器人法治與倫理論壇上中國政法大學(xué)副校長時建中表示,面對擔(dān)憂不應(yīng)過度焦慮,要對人工智能采取包容和審慎態(tài)度,這體現(xiàn)在訓(xùn)練數(shù)據(jù)易獲取、算力與算法鼓勵合作、生成內(nèi)容容錯并及時糾錯等方面。

聯(lián)合國人工智能高級別咨詢機(jī)構(gòu)成員、中國政法大學(xué)數(shù)據(jù)法治研究院教授張凌寒同樣表示,不發(fā)展是最大的不安全,要全力促進(jìn)人工智能的發(fā)展。

“它就像一歲半大的孩子,需要我們的正確引導(dǎo)?!比A東師范大學(xué)人工智能金融學(xué)院院長、教授邵怡蕾表示,目前,人形機(jī)器人在人工智能的加持下已經(jīng)具備感知智能和認(rèn)知智能,最后一座需要攻克的“堡壘”是行為智能。而當(dāng)人形機(jī)器人行為出現(xiàn)在人類社會后,是對人類身份與法律的挑戰(zhàn),這不僅需要對人形機(jī)器人進(jìn)行身份界定,更需要人類對其行為進(jìn)行引導(dǎo)和約束。

如何協(xié)調(diào)機(jī)器人與人類之間的互動?阿西莫夫的“機(jī)器人三定律”曾經(jīng)被視為基礎(chǔ)規(guī)范。但是,當(dāng)具身智能時代來臨之際,這樣的“約法三章”已經(jīng)難以解決人機(jī)共生的復(fù)雜問題,需要一種新的法律治理架構(gòu)。

中國海洋大學(xué)法學(xué)院教授李晟在《東方法學(xué)》人形機(jī)器人法治專刊中表示,治理架構(gòu)需要立足于人形機(jī)器人與人的差距,考慮當(dāng)前發(fā)展階段的應(yīng)用問題,而不是關(guān)注人形機(jī)器人替代人時所產(chǎn)生的未來問題。

排版/ 季嘉穎

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。