界面新聞?dòng)浾?| 伍洋宇
界面新聞編輯 | 宋佳楠
8月21日,2024世界機(jī)器人大會(huì)期間,作為獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶(hù)星空董事長(zhǎng),傅盛就AGI(通用人工智能)、具身智能、大模型機(jī)器人等話題進(jìn)行了演講。
傅盛表示,自己在AI 1.0時(shí)代便看到了機(jī)器人將從傳統(tǒng)的工業(yè)場(chǎng)景走到服務(wù)業(yè)場(chǎng)景,乃至千家萬(wàn)戶(hù)的機(jī)會(huì),因此于七年前投資創(chuàng)辦了獵戶(hù)星空。
而在進(jìn)階程度更高的AI 2.0時(shí)代,他用“人類(lèi)科技史上的奇跡年”來(lái)形容人工智能的這波崛起,認(rèn)為可與牛頓的“萬(wàn)有引力”或是愛(ài)因斯坦“相對(duì)論”的出現(xiàn)相提并論。在他看來(lái),大語(yǔ)言模型帶來(lái)的端到端創(chuàng)新范式的影響,對(duì)全行業(yè)、全社會(huì)都會(huì)產(chǎn)生巨大改變。
受益于ChatGPT在語(yǔ)義理解方面實(shí)現(xiàn)的能力突破,機(jī)器人也迎來(lái)更多發(fā)展機(jī)會(huì),因?yàn)椤?/span>語(yǔ)言實(shí)際上是人類(lèi)真正獨(dú)立于其它物種的核心智能”。
“智能涌現(xiàn)”的整個(gè)過(guò)程可謂“神奇”。用AI教母李飛飛的話來(lái)說(shuō),“大模型是個(gè)灰盒”。伴隨著各種不確定性,OpenAI率先走出一條與眾不同的道路,且實(shí)現(xiàn)了創(chuàng)新。
但傅盛指出,大語(yǔ)言模型并不一定是通往AGI的唯一道路。他贊同Meta首席科學(xué)家楊立昆的觀點(diǎn):大語(yǔ)言模型的天然結(jié)構(gòu)使得它很難實(shí)現(xiàn)AGI。
其中有兩方面考量因素,一是更小參數(shù)的大模型是否同樣可以實(shí)現(xiàn)智能;另一方面,不是所有工作都需要AGI這樣的“愛(ài)因斯坦”,整個(gè)社會(huì)是一個(gè)金字塔形的多元結(jié)構(gòu),基層需要更多平民化的大模型出現(xiàn)。
當(dāng)前,OpenAI、蘋(píng)果、微軟等科技巨頭都在以實(shí)際行動(dòng)驗(yàn)證“小模型”趨勢(shì),這可能讓大模型直接成為端的一部分,而不只是在云上。
今年1月,獵戶(hù)星空也曾發(fā)布小參數(shù)模型Orion-14B。除了考慮大參數(shù)模型的成本昂貴之外,這家公司認(rèn)為,機(jī)器人一定要在端上跑自己的模型,才可能既解決數(shù)據(jù)隱私問(wèn)題,又做到實(shí)時(shí)快速響應(yīng)。
傅盛表示,端模一體帶來(lái)的產(chǎn)品和科技變革的意義將更大,會(huì)直接引發(fā)交互革命和生產(chǎn)力革命,而大模型機(jī)器人是獵戶(hù)星空所押注的賽道。目前,該公司將其分為勞動(dòng)協(xié)作機(jī)器人、接待營(yíng)銷(xiāo)機(jī)器人和遞送配貨機(jī)器人三類(lèi)。
就大模型私有化部署而言,傅盛稱(chēng)自己不僅要負(fù)責(zé)產(chǎn)品,也對(duì)銷(xiāo)售投入了大量精力。他發(fā)現(xiàn),ToB(企業(yè)端)的銷(xiāo)售本身就是一個(gè)產(chǎn)品化過(guò)程。
在他看來(lái),這項(xiàng)業(yè)務(wù)的收入表現(xiàn)不會(huì)是一條很陡峭的曲線,甚至過(guò)去幾年經(jīng)歷過(guò)近乎水平的進(jìn)程。但由于大模型的介入,明年產(chǎn)業(yè)規(guī)??赡軙?huì)有明顯變化。
演講結(jié)束后,傅盛接受了界面新聞等媒體采訪,對(duì)AGI實(shí)現(xiàn)路徑、小模型趨勢(shì)、端模一體、雙足機(jī)器人的未來(lái)等熱門(mén)話題,給出了自己的看法。
以下為采訪實(shí)錄,略作編輯:
問(wèn):你說(shuō)大語(yǔ)言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構(gòu)不行?
傅盛:對(duì)于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說(shuō),現(xiàn)在大語(yǔ)言模型遇到了瓶頸,標(biāo)志性事件就是GPT-5發(fā)不出來(lái)。OpenAI作為一家科技創(chuàng)業(yè)公司,18個(gè)月沒(méi)有發(fā)自己的旗艦產(chǎn)品,而是忙著做Search GPT,或者GPT-4o,說(shuō)明要么是卡著上不去,要么是訓(xùn)練出的效果不太好,沒(méi)有質(zhì)的提升。
硅谷都在盯著GPT-5到底何時(shí)出來(lái),出來(lái)后是不是有大的提升。如果沒(méi)有提升,可能會(huì)有點(diǎn)類(lèi)似出現(xiàn)互聯(lián)網(wǎng)泡沫的感覺(jué)。
我也不知道到底是Scaling law不行,還是Transformer架構(gòu)不行。做大語(yǔ)言模型就是一個(gè)嘗試的過(guò)程。OpenAI有技術(shù)信仰,他們堅(jiān)信這事,靠一個(gè)ChatGPT活過(guò)來(lái)了。但今天到底為什么這樣,以后它的Scaling law能走到什么地方,沒(méi)有原理去證明。此外,新的數(shù)據(jù)從哪里來(lái)也是個(gè)問(wèn)題。
問(wèn):從GPT-4o mini和Apple intelligence來(lái)看,小模型可能是趨勢(shì)。你認(rèn)為端模一體最考驗(yàn)企業(yè)的是什么?這個(gè)能力現(xiàn)在中美有明顯差距嗎?
傅盛:小模型已經(jīng)不斷被驗(yàn)證了。技術(shù)發(fā)展到這一步,一個(gè)幾十億參數(shù)的模型能力已經(jīng)不錯(cuò)了,蘋(píng)果做的所有工作都是在它的小模型上?,F(xiàn)在看起來(lái)端上的需求是很大的,無(wú)論是手機(jī)、電腦,未來(lái)一定是這樣的邏輯。
中美應(yīng)該沒(méi)有太大差距。訓(xùn)練小模型對(duì)算力要求低,需要結(jié)合真正的應(yīng)用場(chǎng)景,這方面中國(guó)有自己的優(yōu)勢(shì),迭代快。包括私有化大模型出海,如果不是美國(guó)的大公司在做,那些創(chuàng)業(yè)公司和中國(guó)的效率還是有差距的。
問(wèn):1月份時(shí),你曾說(shuō)過(guò)超越OpenAI的機(jī)會(huì)一定來(lái)自大模型的應(yīng)用。大半年過(guò)去了,現(xiàn)在看到哪些應(yīng)用的機(jī)會(huì)?
傅盛:那個(gè)時(shí)候,對(duì)于是否做好一個(gè)特別牛的模型就能解決所有問(wèn)題,大家有很多爭(zhēng)議。今天看起來(lái)答案非常明顯,即做好一個(gè)模型也不能解決大多數(shù)問(wèn)題。學(xué)界也在討論,大語(yǔ)言模型到底能不能實(shí)現(xiàn)AGI?去年大家都信心滿滿,現(xiàn)在很多人覺(jué)得不太可能,它只是一個(gè)更好用的工具而已。
我們可能真的不會(huì)遇到一種“萬(wàn)能”技術(shù),所有的技術(shù)最后都要跟不同的場(chǎng)景結(jié)合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡(jiǎn)單的就是燒柴火,而不是建一個(gè)熱力站,不同場(chǎng)景中大家的需求不一樣。
今天可見(jiàn)之處都是應(yīng)用的機(jī)會(huì),只是有些可能不屬于創(chuàng)業(yè)者。比如蘋(píng)果發(fā)布了iOS 18,股價(jià)最高上漲10%。你把手機(jī)改造一下可能有機(jī)會(huì),但只要手機(jī)廠商自己干,你就沒(méi)機(jī)會(huì)。
機(jī)器人也是一個(gè)很大的應(yīng)用。雖然我對(duì)雙足機(jī)器人商業(yè)化不看好,但對(duì)機(jī)器人這個(gè)行業(yè)的發(fā)展充滿了信心。
大語(yǔ)言模型出來(lái)之前,讓機(jī)器人拿杯子是個(gè)世界級(jí)難題,當(dāng)時(shí)大家都是絕望的,認(rèn)為不可能做成。但今天有了大語(yǔ)言模型,它自己具備了規(guī)劃、判斷和模糊的體驗(yàn),能讓機(jī)器人成為很重要的產(chǎn)品載體。
問(wèn):為什么不看好雙足機(jī)器人商業(yè)化?
傅盛:技術(shù)過(guò)于復(fù)雜。雙足機(jī)器人必須依賴(lài)于機(jī)械結(jié)構(gòu),但結(jié)構(gòu)不是摩爾定律支撐的,每年能改一點(diǎn)點(diǎn)就不錯(cuò)了。就像汽車(chē)剎車(chē)系統(tǒng)、底盤(pán),一百年過(guò)去了,改了多少?
雙足機(jī)器人進(jìn)展比較慢,今天是電機(jī)問(wèn)題,明天也是,最多電機(jī)大一點(diǎn)。為了雙足犧牲了太多,包括產(chǎn)品的能耗和穩(wěn)定性。雙足機(jī)器人要解決摔倒的問(wèn)題,而人的穩(wěn)定性相當(dāng)高。
再者是成本,用幾個(gè)電機(jī)和輪子相比,它成本一定高,還要保證在99%以上的場(chǎng)景不能出錯(cuò)。
作為一個(gè)研究方向是可以的,但說(shuō)現(xiàn)在雙足機(jī)器人要大行其道,我不看好。每個(gè)人的夢(mèng)想都值得鼓勵(lì),但還得看能不能真正量產(chǎn),以及量產(chǎn)以后市場(chǎng)的接受程度。
問(wèn):雙足機(jī)器人做科研的這幾年,主要是解決哪些問(wèn)題?
傅盛:結(jié)構(gòu)的靈活性問(wèn)題以及算法問(wèn)題。膝蓋是非常復(fù)雜的,有各種肌肉、小關(guān)節(jié),還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機(jī)器人是鋼鐵的東西,沒(méi)有這些,只能靠算法。由于端到端,算法的確進(jìn)步很大,像波士頓動(dòng)力以前所有的積累可能都廢了,但難度還是挺大的。
問(wèn):如果三五年之后,它們真的能落到產(chǎn)線上,會(huì)改變你的看法嗎?
傅盛:不會(huì),因?yàn)槟隳苈湓诋a(chǎn)業(yè)上,我一個(gè)輪子的結(jié)構(gòu)也能落,而且永遠(yuǎn)比你便宜100倍以上。今天你花20萬(wàn)買(mǎi)輛汽車(chē),一下能開(kāi)出去100公里。有一天來(lái)了一匹機(jī)械馬,需要100多萬(wàn),你買(mǎi)車(chē)還是買(mǎi)馬?車(chē)就是這么打敗馬的。
機(jī)器人用輪子很有優(yōu)勢(shì),等到有一天產(chǎn)品真正穩(wěn)定的時(shí)候,其實(shí)干活是用上半肢。
問(wèn):有一些雙足或者人形機(jī)器人的研報(bào),會(huì)說(shuō)現(xiàn)在處在人形機(jī)器人的“前夜”,你是否認(rèn)同這樣的觀點(diǎn)?
傅盛:去年(特斯拉)“擎天柱”出來(lái)的時(shí)候,很多投資人都很受震動(dòng)。當(dāng)時(shí)特斯拉放話,再過(guò)一兩年,能達(dá)到幾萬(wàn)臺(tái)或者10萬(wàn)臺(tái)的規(guī)模。當(dāng)時(shí)我說(shuō)不可能,今天話就放在這。
之前特斯拉說(shuō)明年會(huì)有1000臺(tái)“擎天柱”進(jìn)入工廠,但我認(rèn)為它們做不到很好地工作。以特斯拉的實(shí)力,放1000臺(tái)去測(cè)試是可以的。
一些企業(yè)講人形機(jī)器人產(chǎn)線搬運(yùn),這完全是作秀,搬運(yùn)為什么不用叉車(chē)?用加機(jī)械臂的叉車(chē)不行嗎?一個(gè)輪子能拉100公斤,人形機(jī)器人搬運(yùn)兩公斤就不禁摔,更別說(shuō)造價(jià)多少。
現(xiàn)在離“前夜”很遠(yuǎn)很遠(yuǎn)。2017年,我的團(tuán)隊(duì)就拿機(jī)器人點(diǎn)蠟燭,好多機(jī)械臂廠商也說(shuō)要改變行業(yè),后來(lái)發(fā)現(xiàn)這個(gè)行業(yè)真的很難改變,因?yàn)闄C(jī)械結(jié)構(gòu)是一點(diǎn)點(diǎn)磨出來(lái)的。不能因?yàn)榘B ゑR斯克做了這個(gè)事就覺(jué)得一定行。人都有驕傲的時(shí)候,他也不例外,沒(méi)有神嘛。
問(wèn):大模型機(jī)器人是怎樣一個(gè)概念?
傅盛:有點(diǎn)“具身智能”的概念。大模型通過(guò)語(yǔ)言的學(xué)習(xí)構(gòu)建了對(duì)這個(gè)世界的基本邏輯和認(rèn)知。大語(yǔ)言模型可以做出規(guī)劃,反饋給人,這比以前(做機(jī)器人)的技術(shù)難度要低很多,要知道以前所有的移動(dòng)都得寫(xiě)控制代碼,寫(xiě)起來(lái)很費(fèi)勁。
大模型是實(shí)現(xiàn)具身智能的推動(dòng)力,是一個(gè)基礎(chǔ)條件。在沒(méi)有大模型之前,(機(jī)器)理解世界是不可想象的。
問(wèn):這個(gè)概念為什么這兩年才火起來(lái),它和之前的那些智能化的機(jī)器人傳感器等有什么不同?
傅盛:之前的很多智能化可以理解成一種程序化的過(guò)程,比如先幫你預(yù)設(shè)好,看了一個(gè)什么東西去點(diǎn)一下,這已經(jīng)算很高級(jí)了。最早的都不需要交互,自動(dòng)化完全匹配,這是第一階段。
第二階段有一定判別的技能,我們叫做“規(guī)則”。規(guī)則很難容納太多的東西,比如突然出現(xiàn)一杯水,但(代碼)沒(méi)寫(xiě)就傻了。有了大語(yǔ)言模型,它可以理解世界,知道這是水,只要有足夠多的數(shù)據(jù),就不用再寫(xiě)規(guī)則代碼,而是通過(guò)各種方式去獲得更多的數(shù)據(jù)進(jìn)行訓(xùn)練。這也是為什么“具身智能”一下火起來(lái)了。
問(wèn):獵戶(hù)星空服務(wù)機(jī)器人在海外市場(chǎng)主要的應(yīng)用場(chǎng)景是哪些?中國(guó)的機(jī)器人產(chǎn)品出海要進(jìn)一步克服哪些困難?
傅盛:目前獵戶(hù)星空機(jī)器人主要還是遞送類(lèi),在餐廳送餐、回盤(pán),也有一些交互類(lèi)的,去做講解、引導(dǎo)等工作。
海外需求相對(duì)旺盛,因?yàn)榘l(fā)達(dá)國(guó)家勞動(dòng)力比較貴,而且稀缺。要進(jìn)一步打開(kāi)市場(chǎng),就得用大模型把它智能化。
我們?cè)诤M庥龅搅艘恍﹩?wèn)題,也在慢慢克服。早期部署成本很高,不僅機(jī)器人過(guò)去,也要讓商家會(huì)用。我們未來(lái)的目標(biāo)是實(shí)現(xiàn)“開(kāi)箱即用”,機(jī)器人做到這個(gè)并不容易,它得認(rèn)識(shí)環(huán)境。以前需要人去給它建圖,現(xiàn)在有了大語(yǔ)言模型,這件事的難度會(huì)大幅度降低,甚至可以實(shí)現(xiàn)自動(dòng)化。
另一個(gè)問(wèn)題是交互能力。我們?cè)诤M庖恢睕](méi)有做交互,因?yàn)槊總€(gè)國(guó)家語(yǔ)言不同,還得做定制,非常復(fù)雜。而大語(yǔ)言模型天然就是翻譯機(jī),像獵戶(hù)星空大模型(Orion-14B)的日語(yǔ)能力在開(kāi)源模型里是比較好的,因?yàn)槲覀冋J(rèn)真訓(xùn)練了一下日語(yǔ)。最神奇的是,你都不用管它,只要把日語(yǔ)輸出給它,它自然就會(huì)了,而且會(huì)翻譯。這放以前也是一種顛覆,是它的天然能力。機(jī)器人未來(lái)要把智能化再提高,拓展它的應(yīng)用場(chǎng)景。
我雖然不看好人形機(jī)器人,但覺(jué)得機(jī)械臂去做一些動(dòng)作是可以的。我們下半年會(huì)有機(jī)械臂方面的產(chǎn)品推出,因?yàn)樗谀承﹫?chǎng)景下能夠?qū)崿F(xiàn)一定的任務(wù)。
問(wèn):SaaS在中國(guó)差不多被驗(yàn)證是失敗的,獵豹現(xiàn)在做私有化大模型,會(huì)不會(huì)也會(huì)面臨企業(yè)付費(fèi)意愿低的問(wèn)題?畢竟現(xiàn)在AI應(yīng)用還沒(méi)有產(chǎn)生多少收入,包括國(guó)外也是。
傅盛:是的。我們現(xiàn)在在和頭部的企業(yè)合作,一期已經(jīng)在交付,二期正在做,我們認(rèn)為是有可能標(biāo)準(zhǔn)化的。
中國(guó)的市場(chǎng)我可能改變不了,但只要做好,讓企業(yè)都能滿意,我們就把它標(biāo)準(zhǔn)化,下一步再出海去做。出海本就是我們的基因,很多海外客戶(hù)也愿意接受(私有化大模型)。海外市場(chǎng)足夠大,愿意付費(fèi)。經(jīng)過(guò)中國(guó)市場(chǎng)驗(yàn)證的產(chǎn)品模式,現(xiàn)在到全球都是有競(jìng)爭(zhēng)力的。
問(wèn):你覺(jué)得窗口期大概有多久?
傅盛:最多就到年底,一步一步來(lái),我用更長(zhǎng)的時(shí)間來(lái)看這件事情時(shí),思路就會(huì)不太一樣,現(xiàn)在就是盯效果,真要說(shuō)多拿幾單進(jìn)來(lái)也不是不能。
問(wèn):在獵戶(hù)星空這邊,你的精力主要放在產(chǎn)品這塊嗎?
傅盛:現(xiàn)在是,銷(xiāo)售上我也得花精力。我后來(lái)意識(shí)到,ToB和ToC最大的不同,就是ToB銷(xiāo)售本身就是一個(gè)產(chǎn)品化的過(guò)程。
比如說(shuō)私有化大模型跟做ToC不一樣,做ToC我自己覺(jué)得這個(gè)產(chǎn)品不錯(cuò),不需要ToB。但是ToB必須要了解客戶(hù),這對(duì)我們以前做ToC的團(tuán)隊(duì)來(lái)講是個(gè)挑戰(zhàn),這兩年慢慢積累了一些經(jīng)驗(yàn),學(xué)了不少。
問(wèn):這種業(yè)務(wù)收入規(guī)模的提升,大概是一條什么樣的曲線?有所謂爆發(fā)節(jié)點(diǎn)嗎?
傅盛:ToB的肯定不會(huì)那么快,前幾年其實(shí)還在水平線上,今年開(kāi)始產(chǎn)品化,能再做好一些。大語(yǔ)言模型是讓整個(gè)機(jī)器人場(chǎng)景發(fā)生了很大的拓展。我今天展示的講解、直播機(jī)器人,以前是很難實(shí)現(xiàn)的,現(xiàn)在能做到接近于人的水平,明年它的增長(zhǎng)可能會(huì)比較大。