文|劉曠
回望2023年,人形機(jī)器人賽道好不熱鬧,受政策支持、AI技術(shù)突破、投資熱潮等利好因素共同影響,眾多玩家紛紛入局加碼發(fā)力。在整個賽道持續(xù)爆炒之下,行業(yè)也迅速站上了產(chǎn)業(yè)風(fēng)口。
其實(shí),從很多方面來看,機(jī)器人行業(yè)站上風(fēng)口并非偶然,而是多年來行業(yè)內(nèi)外各種技術(shù)成熟帶來的必然結(jié)果。
人形機(jī)器人迎來AI產(chǎn)業(yè)東風(fēng)
早在1973年,日本早稻田大學(xué)加藤一郎,就帶領(lǐng)團(tuán)隊(duì)研發(fā)出了世界第一臺真人大小的人形智能機(jī)器人—WABOT-1。然而,到今天為止半個世紀(jì)過去了,事關(guān)機(jī)器人的商業(yè)化依然遙遙無期,究其根本,成本、性能這些仍是最基本的核心阻力。具體來看,機(jī)器人由運(yùn)動模塊、傳感模塊和人工智能模塊,三個關(guān)鍵技術(shù)模塊組成。
對于一般的傳統(tǒng)機(jī)器人來說,只需要其中一種技術(shù)往往就已經(jīng)具備使用價值了。比如,工業(yè)機(jī)器人主要側(cè)重于運(yùn)動控制技術(shù),掃地機(jī)器人則側(cè)重于導(dǎo)航傳感技術(shù)。相比之下,人形機(jī)器人的通用性要求則更高,其在應(yīng)用上超越了以往機(jī)器人僅僅適用于特定場景的局限,而被更多應(yīng)用于其他場景之中。如此一來,其技術(shù)的復(fù)雜性就開始指數(shù)級倍增,其不僅需要強(qiáng)大的數(shù)據(jù)建模,還要對語言和指令有強(qiáng)大的理解力。但AI大模型的突破,讓這些從前看似不可能解決的問題,逐漸有了全新的解法。
大模型從之前的Transformer再到GPT-4,隨著模型的參數(shù)量不斷呈現(xiàn)指數(shù)級躍遷,大模型也從之前的文本,逐漸走到語音、視覺等多模態(tài)融合的通用AI方向發(fā)展,這也讓人形機(jī)器人與語音、視覺、決策和控制等融合起來,以提升人形機(jī)器人的能力值成為可能。其實(shí)放在整個行業(yè)來看,這只是AI助力機(jī)器人行業(yè)核心技術(shù)加快突破的一個方面,其更多體現(xiàn)在AI助力機(jī)器人具形化。
首先,是通過強(qiáng)調(diào)AI的泛化能力,基于對人類動作的模仿,使得人形機(jī)器人具備自主決策、自主學(xué)習(xí)升級的能力,以提升任務(wù)的完整性和連貫性。其次,是末端執(zhí)行能力。強(qiáng)調(diào)靈巧機(jī)器手的操作精度,在中央分析器“大腦”的運(yùn)算決策下,人形機(jī)器人的動作輸出應(yīng)精準(zhǔn)、降低失誤率,提升任務(wù)完成的正確性和準(zhǔn)確性。最后,基于感知的運(yùn)動控制能力:強(qiáng)調(diào)底盤的全地形移動能力,類似自動駕駛,人形機(jī)器人應(yīng)基于對周圍環(huán)境的感知實(shí)現(xiàn),對自身的運(yùn)動控制,增強(qiáng)全移動操作能力,提升任務(wù)完成的時效性。
總之,借助AI技術(shù),傳統(tǒng)困擾人形機(jī)器人發(fā)展的諸多困難,逐漸得到一一破解。
新問題接踵而至
從行業(yè)來看,底層技術(shù)的高速進(jìn)化,讓外界開始重新審視這個陌生又熟悉的賽道。但就人形機(jī)器人的真正產(chǎn)業(yè)化進(jìn)程來看,其距離真正進(jìn)入千家萬戶還有一段路要走。
首先,是對人形機(jī)器人智能化起至關(guān)重要的數(shù)據(jù),仍存在局限。ChatGPT之所以能夠在短時間內(nèi)快速迭代,是因?yàn)榛ヂ?lián)網(wǎng)上已經(jīng)沉淀了大量公域的數(shù)據(jù),可供其直接抓取使用,人形機(jī)器人則不然,現(xiàn)實(shí)中的機(jī)器人保有量本就很少,可用于收集數(shù)據(jù)的機(jī)器人就更少了,這樣人形機(jī)器人的數(shù)據(jù)采集,自然就成了問題。特別是考慮到各個機(jī)器人廠商之間為了保護(hù)自家數(shù)據(jù),互設(shè)壁壘、自建圍墻,這種各自為戰(zhàn)的狀態(tài),無疑又加大了數(shù)據(jù)獲取的難度,進(jìn)而影響到各家機(jī)器人的迭代。
?事實(shí)上,目前匯集全球34個機(jī)器人實(shí)驗(yàn)室的60多個現(xiàn)有數(shù)據(jù)集,就包含從22種機(jī)器人上采集的超過15萬個任務(wù)的上百萬條數(shù)據(jù),谷歌開源的機(jī)器人訓(xùn)練數(shù)據(jù)集Open X-Embodiment,可以說是機(jī)器人模型領(lǐng)域的一面旗幟,但該數(shù)據(jù)集主要針對的仍是一些常規(guī)操作,在全身肢體協(xié)調(diào)、行走平衡等方面依然會有所欠缺。
其次,受到算力的制約,目前人形機(jī)器人根本無法實(shí)時響應(yīng)命令。通用人形機(jī)器人在控制周期上,需要達(dá)到500Hz的水平,而目前谷歌研發(fā)的RT-2模型,在機(jī)器人控制周期上只能達(dá)到3Hz,差了兩個數(shù)量級還多。最后也是最重要的,就是成本,現(xiàn)在動不動幾萬美金的售價,根本不支持在C端大面積普及。以此來看,人形機(jī)器人目前的進(jìn)展仍然非常有限。
國產(chǎn)替代按下加速鍵
事實(shí)上,隨著國內(nèi)市場的火熱,國內(nèi)人形機(jī)器人產(chǎn)業(yè)加速替代的風(fēng)潮,更是一浪賽過一浪,國產(chǎn)化替代正式按下加速鍵。
首先,從需求端來看,隨著國內(nèi)人力成本的逐漸攀升,國內(nèi)對機(jī)器人的需求逐漸上升,這在一定程度上激發(fā)了企業(yè)參與機(jī)器人的熱情。縱觀主要發(fā)達(dá)國家的情況不難發(fā)現(xiàn),自上世紀(jì)90年代以來,隨著發(fā)達(dá)國家勞動力成本不斷攀升,機(jī)器人產(chǎn)業(yè)曾經(jīng)有過一段比較快速的發(fā)展。但隨著主要發(fā)展中國家加入WTO,其人口紅利逐漸釋放,全球產(chǎn)業(yè)迎來巨大的發(fā)展。
但如今隨著主要發(fā)展中國家如中國,勞動力成本的逐漸提升,世界范圍內(nèi)圍繞機(jī)器人的產(chǎn)業(yè)革新,正逐漸成為一種趨勢。畢竟,客觀上來看,中國國內(nèi)的產(chǎn)業(yè)鏈轉(zhuǎn)移不可避免,但放眼全世界,能夠像中國這樣擁有大量高素質(zhì)勞動力群體的國家并不多,更找不到這樣高度穩(wěn)定的社會環(huán)境。最近幾年,雖然中國的部分低端產(chǎn)業(yè)轉(zhuǎn)移到了東南亞,但實(shí)際效果不及預(yù)期。在這種情況下,寄希望于留在中國的供應(yīng)商,紛紛將主要精力放在了機(jī)器人上,這客觀上助推了中國機(jī)器人產(chǎn)業(yè)的發(fā)展。
其次,從技術(shù)與產(chǎn)業(yè)來看,國內(nèi)有足夠多的優(yōu)質(zhì)潛力供應(yīng)商和應(yīng)用場景,這是國內(nèi)實(shí)現(xiàn)國產(chǎn)替代的核心關(guān)鍵。從人形機(jī)器人的具體構(gòu)成來看,其主要涉及到減速器、伺服、控制器等,其合計(jì)占工業(yè)機(jī)器人成本的70%,考慮到機(jī)器人關(guān)節(jié)和自由度更多,其實(shí)際的占比可能會更高。
而在這些方向上,國產(chǎn)供應(yīng)商也已經(jīng)嶄露頭角,比如減速器領(lǐng)域,就有大族傳動、來福諧波、
同川科技、中大力德、綠的諧波等眾多上市公司,其中綠的諧波已經(jīng)形成良性循環(huán),作為一家制造企業(yè),其凈利潤率已經(jīng)做到了30%以上堪稱奇跡。伺服領(lǐng)域,匯川技術(shù)的預(yù)期較高,其一家就在國內(nèi)伺服領(lǐng)域占據(jù)21.5%的市占率。控制器領(lǐng)域,目前雖然未形成強(qiáng)勢供應(yīng)商企業(yè),但產(chǎn)業(yè)中并不乏替代者。應(yīng)用場景方面,國內(nèi)人口規(guī)模巨大、制造業(yè)發(fā)達(dá),不管是B端還是C端消費(fèi),機(jī)器人都有巨大的應(yīng)用場景,這是人形機(jī)器人在國內(nèi)國產(chǎn)替代的先天機(jī)遇。
總之,在各方面因素的推動下,人形機(jī)器人的國產(chǎn)替代也進(jìn)入加速期。
2024,人形機(jī)器人春天已到?
在行業(yè)快速發(fā)展之下,業(yè)內(nèi)不時傳來2024是機(jī)器人元年的說法。不過,從行業(yè)現(xiàn)狀來看,2024年只能算是人形機(jī)器人小規(guī)模落地的一年,距離真正的產(chǎn)業(yè)元年還有差距。
首先,從行業(yè)來看人形機(jī)器人所涉及的技術(shù)面非常復(fù)雜,沒辦法一蹴而就。在業(yè)內(nèi)人士看來,過去一年的確是行業(yè)變化較快的一年,但行業(yè)距離真正的爆發(fā)卻仍然有不少差距,因?yàn)榈侥壳盀橹?,行業(yè)內(nèi)也并沒有太多的本質(zhì)變化,這主要是因?yàn)槿诵螜C(jī)器人,涉及到了高端制造、人工智能等諸多領(lǐng)域,其技術(shù)廣度和深度都非同一般。
別的且不說,就說剛剛上市的機(jī)器人公司優(yōu)必選,其從2012年發(fā)展至今已經(jīng)有10多年了,但其無論是在核心技術(shù)還是在產(chǎn)業(yè)化方面,仍在持續(xù)投入。對于當(dāng)下的行業(yè)來說,更重要的是利用巨大的關(guān)注,沉下心來做好技術(shù)和產(chǎn)業(yè)的迭代,將更多資源投在一些核心技術(shù)研發(fā),以及卡脖子的關(guān)鍵研究上去,真正實(shí)現(xiàn)從研發(fā)到產(chǎn)品,再到應(yīng)用、服務(wù)的整個商業(yè)閉環(huán)。
其次,就是涉及到人形機(jī)器人具身智能的數(shù)據(jù)、硬件成本等問題,仍需要時間去解決。具體到大模型方面來說,前文提到目前適用于各種智能的數(shù)據(jù)都很少,而且無論是云端還是邊緣側(cè),都涉及到巨大的算力消耗,各種適用于各類場景的泛化理解的解決,也需要時間來完成。
另外,從驅(qū)動器、減速器、關(guān)節(jié)、靈巧手等,企業(yè)都需要成熟的供應(yīng)商磨合,去迭代和控制成本,這在目前都不成熟。
而在具體的技術(shù)上,機(jī)器人行業(yè)的問題集中在硬件的標(biāo)準(zhǔn)化,以及操作算法的范式上。在可預(yù)見的未來,硬件的標(biāo)準(zhǔn)化或?qū)⒊蔀橥苿有袠I(yè)降本的核心抓手。盡管當(dāng)下來看,人類關(guān)于機(jī)器人的理想與現(xiàn)實(shí),早已經(jīng)變得視線模糊了,但理想與現(xiàn)實(shí)終究還是有著一線之隔,這種糾葛決定了機(jī)器人產(chǎn)業(yè)化之路,并不能非??斓脑诋a(chǎn)業(yè)內(nèi)完成。