正在閱讀:

對(duì)話獵豹移動(dòng)傅盛:“大”模型不是通往AGI的唯一路徑

掃一掃下載界面新聞APP

對(duì)話獵豹移動(dòng)傅盛:“大”模型不是通往AGI的唯一路徑

“我們可能真的不會(huì)遇到一種‘萬能’技術(shù),所有的技術(shù)最后都要跟不同的場(chǎng)景結(jié)合。即便有這樣的能力,還要考慮成本。”

圖片來源:獵豹移動(dòng)

界面新聞?dòng)浾?| 伍洋宇

界面新聞編輯 | 宋佳楠

8月21日,2024世界機(jī)器人大會(huì)期間,作為獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng),傅盛就AGI(通用人工智能)、具身智能、大模型機(jī)器人等話題進(jìn)行了演講。

傅盛表示,自己在AI 1.0時(shí)代便看到了機(jī)器人將從傳統(tǒng)的工業(yè)場(chǎng)景走到服務(wù)業(yè)場(chǎng)景,乃至千家萬戶的機(jī)會(huì),因此于七年前投資創(chuàng)辦了獵戶星空。

而在進(jìn)階程度更高的AI 2.0時(shí)代,他用“人類科技史上的奇跡年”來形容人工智能的這波崛起,認(rèn)為可與牛頓的“萬有引力”或是愛因斯坦“相對(duì)論”的出現(xiàn)相提并論。在他看來,大語言模型帶來的端到端創(chuàng)新范式的影響,對(duì)全行業(yè)、全社會(huì)都會(huì)產(chǎn)生巨大改變。

受益于ChatGPT在語義理解方面實(shí)現(xiàn)的能力突破,機(jī)器人也迎來更多發(fā)展機(jī)會(huì),因?yàn)椤?/span>語言實(shí)際上是人類真正獨(dú)立于其它物種的核心智能”。 

“智能涌現(xiàn)”的整個(gè)過程可謂“神奇”。用AI教母李飛飛的話來說,“大模型是個(gè)灰盒”。伴隨著各種不確定性,OpenAI率先走出一條與眾不同的道路,且實(shí)現(xiàn)了創(chuàng)新。

但傅盛指出,大語言模型并不一定是通往AGI的唯一道路。他贊同Meta首席科學(xué)家楊立昆的觀點(diǎn):大語言模型的天然結(jié)構(gòu)使得它很難實(shí)現(xiàn)AGI。

其中有兩方面考量因素,一是更小參數(shù)的大模型是否同樣可以實(shí)現(xiàn)智能;另一方面,不是所有工作都需要AGI這樣的“愛因斯坦”,整個(gè)社會(huì)是一個(gè)金字塔形的多元結(jié)構(gòu),基層需要更多平民化的大模型出現(xiàn)。

當(dāng)前,OpenAI、蘋果、微軟等科技巨頭都在以實(shí)際行動(dòng)驗(yàn)證“小模型”趨勢(shì),這可能讓大模型直接成為端的一部分,而不只是在云上。

今年1月,獵戶星空也曾發(fā)布小參數(shù)模型Orion-14B。除了考慮大參數(shù)模型的成本昂貴之外,這家公司認(rèn)為,機(jī)器人一定要在端上跑自己的模型,才可能既解決數(shù)據(jù)隱私問題,又做到實(shí)時(shí)快速響應(yīng)。 

傅盛表示,端模一體帶來的產(chǎn)品和科技變革的意義將更大,會(huì)直接引發(fā)交互革命和生產(chǎn)力革命,而大模型機(jī)器人是獵戶星空所押注的賽道。目前,該公司將其分為勞動(dòng)協(xié)作機(jī)器人、接待營(yíng)銷機(jī)器人和遞送配貨機(jī)器人三類。

就大模型私有化部署而言,傅盛稱自己不僅要負(fù)責(zé)產(chǎn)品,也對(duì)銷售投入了大量精力。他發(fā)現(xiàn),ToB(企業(yè)端)的銷售本身就是一個(gè)產(chǎn)品化過程。

在他看來,這項(xiàng)業(yè)務(wù)的收入表現(xiàn)不會(huì)是一條很陡峭的曲線,甚至過去幾年經(jīng)歷過近乎水平的進(jìn)程。但由于大模型的介入,明年產(chǎn)業(yè)規(guī)??赡軙?huì)有明顯變化。

演講結(jié)束后,傅盛接受了界面新聞等媒體采訪,對(duì)AGI實(shí)現(xiàn)路徑、小模型趨勢(shì)、端模一體、雙足機(jī)器人的未來等熱門話題,給出了自己的看法。

以下為采訪實(shí)錄,略作編輯:

問:你說大語言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構(gòu)不行?

傅盛:對(duì)于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說,現(xiàn)在大語言模型遇到了瓶頸,標(biāo)志性事件就是GPT-5發(fā)不出來。OpenAI作為一家科技創(chuàng)業(yè)公司,18個(gè)月沒有發(fā)自己的旗艦產(chǎn)品,而是忙著做Search GPT,或者GPT-4o,說明要么是卡著上不去,要么是訓(xùn)練出的效果不太好,沒有質(zhì)的提升。

硅谷都在盯著GPT-5到底何時(shí)出來,出來后是不是有大的提升。如果沒有提升,可能會(huì)有點(diǎn)類似出現(xiàn)互聯(lián)網(wǎng)泡沫的感覺。

我也不知道到底是Scaling law不行,還是Transformer架構(gòu)不行。做大語言模型就是一個(gè)嘗試的過程。OpenAI有技術(shù)信仰,他們堅(jiān)信這事,靠一個(gè)ChatGPT活過來了。但今天到底為什么這樣,以后它的Scaling law能走到什么地方,沒有原理去證明。此外,新的數(shù)據(jù)從哪里來也是個(gè)問題。

問:從GPT-4o mini和Apple intelligence來看,小模型可能是趨勢(shì)。你認(rèn)為端模一體最考驗(yàn)企業(yè)的是什么?這個(gè)能力現(xiàn)在中美有明顯差距嗎?

傅盛:小模型已經(jīng)不斷被驗(yàn)證了。技術(shù)發(fā)展到這一步,一個(gè)幾十億參數(shù)的模型能力已經(jīng)不錯(cuò)了,蘋果做的所有工作都是在它的小模型上?,F(xiàn)在看起來端上的需求是很大的,無論是手機(jī)、電腦,未來一定是這樣的邏輯。

中美應(yīng)該沒有太大差距。訓(xùn)練小模型對(duì)算力要求低,需要結(jié)合真正的應(yīng)用場(chǎng)景,這方面中國(guó)有自己的優(yōu)勢(shì),迭代快。包括私有化大模型出海,如果不是美國(guó)的大公司在做,那些創(chuàng)業(yè)公司和中國(guó)的效率還是有差距的。

問:1月份時(shí),你曾說過超越OpenAI的機(jī)會(huì)一定來自大模型的應(yīng)用。大半年過去了,現(xiàn)在看到哪些應(yīng)用的機(jī)會(huì)?  

傅盛:那個(gè)時(shí)候,對(duì)于是否做好一個(gè)特別牛的模型就能解決所有問題,大家有很多爭(zhēng)議。今天看起來答案非常明顯,即做好一個(gè)模型也不能解決大多數(shù)問題。學(xué)界也在討論,大語言模型到底能不能實(shí)現(xiàn)AGI?去年大家都信心滿滿,現(xiàn)在很多人覺得不太可能,它只是一個(gè)更好用的工具而已。 

我們可能真的不會(huì)遇到一種“萬能”技術(shù),所有的技術(shù)最后都要跟不同的場(chǎng)景結(jié)合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡(jiǎn)單的就是燒柴火,而不是建一個(gè)熱力站,不同場(chǎng)景中大家的需求不一樣。

今天可見之處都是應(yīng)用的機(jī)會(huì),只是有些可能不屬于創(chuàng)業(yè)者。比如蘋果發(fā)布了iOS 18,股價(jià)最高上漲10%。你把手機(jī)改造一下可能有機(jī)會(huì),但只要手機(jī)廠商自己干,你就沒機(jī)會(huì)。

機(jī)器人也是一個(gè)很大的應(yīng)用。雖然我對(duì)雙足機(jī)器人商業(yè)化不看好,但對(duì)機(jī)器人這個(gè)行業(yè)的發(fā)展充滿了信心。

大語言模型出來之前,讓機(jī)器人拿杯子是個(gè)世界級(jí)難題,當(dāng)時(shí)大家都是絕望的,認(rèn)為不可能做成。但今天有了大語言模型,它自己具備了規(guī)劃、判斷和模糊的體驗(yàn),能讓機(jī)器人成為很重要的產(chǎn)品載體。 

問:為什么不看好雙足機(jī)器人商業(yè)化?

傅盛:技術(shù)過于復(fù)雜。雙足機(jī)器人必須依賴于機(jī)械結(jié)構(gòu),但結(jié)構(gòu)不是摩爾定律支撐的,每年能改一點(diǎn)點(diǎn)就不錯(cuò)了。就像汽車剎車系統(tǒng)、底盤,一百年過去了,改了多少?

雙足機(jī)器人進(jìn)展比較慢,今天是電機(jī)問題,明天也是,最多電機(jī)大一點(diǎn)。為了雙足犧牲了太多,包括產(chǎn)品的能耗和穩(wěn)定性。雙足機(jī)器人要解決摔倒的問題,而人的穩(wěn)定性相當(dāng)高。

再者是成本,用幾個(gè)電機(jī)和輪子相比,它成本一定高,還要保證在99%以上的場(chǎng)景不能出錯(cuò)。

作為一個(gè)研究方向是可以的,但說現(xiàn)在雙足機(jī)器人要大行其道,我不看好。每個(gè)人的夢(mèng)想都值得鼓勵(lì),但還得看能不能真正量產(chǎn),以及量產(chǎn)以后市場(chǎng)的接受程度。

問:雙足機(jī)器人做科研的這幾年,主要是解決哪些問題?

傅盛:結(jié)構(gòu)的靈活性問題以及算法問題。膝蓋是非常復(fù)雜的,有各種肌肉、小關(guān)節(jié),還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機(jī)器人是鋼鐵的東西,沒有這些,只能靠算法。由于端到端,算法的確進(jìn)步很大,像波士頓動(dòng)力以前所有的積累可能都廢了,但難度還是挺大的。 

問:如果三五年之后,它們真的能落到產(chǎn)線上,會(huì)改變你的看法嗎?

傅盛:不會(huì),因?yàn)槟隳苈湓诋a(chǎn)業(yè)上,我一個(gè)輪子的結(jié)構(gòu)也能落,而且永遠(yuǎn)比你便宜100倍以上。今天你花20萬買輛汽車,一下能開出去100公里。有一天來了一匹機(jī)械馬,需要100多萬,你買車還是買馬?車就是這么打敗馬的。

機(jī)器人用輪子很有優(yōu)勢(shì),等到有一天產(chǎn)品真正穩(wěn)定的時(shí)候,其實(shí)干活是用上半肢。

問:有一些雙足或者人形機(jī)器人的研報(bào),會(huì)說現(xiàn)在處在人形機(jī)器人的“前夜”,你是否認(rèn)同這樣的觀點(diǎn)?

傅盛:去年(特斯拉)“擎天柱”出來的時(shí)候,很多投資人都很受震動(dòng)。當(dāng)時(shí)特斯拉放話,再過一兩年,能達(dá)到幾萬臺(tái)或者10萬臺(tái)的規(guī)模。當(dāng)時(shí)我說不可能,今天話就放在這。

之前特斯拉說明年會(huì)有1000臺(tái)“擎天柱”進(jìn)入工廠,但我認(rèn)為它們做不到很好地工作。以特斯拉的實(shí)力,放1000臺(tái)去測(cè)試是可以的。

一些企業(yè)講人形機(jī)器人產(chǎn)線搬運(yùn),這完全是作秀,搬運(yùn)為什么不用叉車?用加機(jī)械臂的叉車不行嗎?一個(gè)輪子能拉100公斤,人形機(jī)器人搬運(yùn)兩公斤就不禁摔,更別說造價(jià)多少。

現(xiàn)在離“前夜”很遠(yuǎn)很遠(yuǎn)。2017年,我的團(tuán)隊(duì)就拿機(jī)器人點(diǎn)蠟燭,好多機(jī)械臂廠商也說要改變行業(yè),后來發(fā)現(xiàn)這個(gè)行業(yè)真的很難改變,因?yàn)闄C(jī)械結(jié)構(gòu)是一點(diǎn)點(diǎn)磨出來的。不能因?yàn)榘B ゑR斯克做了這個(gè)事就覺得一定行。人都有驕傲的時(shí)候,他也不例外,沒有神嘛。 

問:大模型機(jī)器人是怎樣一個(gè)概念?

傅盛:有點(diǎn)“具身智能”的概念。大模型通過語言的學(xué)習(xí)構(gòu)建了對(duì)這個(gè)世界的基本邏輯和認(rèn)知。大語言模型可以做出規(guī)劃,反饋給人,這比以前(做機(jī)器人)的技術(shù)難度要低很多,要知道以前所有的移動(dòng)都得寫控制代碼,寫起來很費(fèi)勁。 

大模型是實(shí)現(xiàn)具身智能的推動(dòng)力,是一個(gè)基礎(chǔ)條件。在沒有大模型之前,(機(jī)器)理解世界是不可想象的。 

問:這個(gè)概念為什么這兩年才火起來,它和之前的那些智能化的機(jī)器人傳感器等有什么不同?

傅盛:之前的很多智能化可以理解成一種程序化的過程,比如先幫你預(yù)設(shè)好,看了一個(gè)什么東西去點(diǎn)一下,這已經(jīng)算很高級(jí)了。最早的都不需要交互,自動(dòng)化完全匹配,這是第一階段。

第二階段有一定判別的技能,我們叫做“規(guī)則”。規(guī)則很難容納太多的東西,比如突然出現(xiàn)一杯水,但(代碼)沒寫就傻了。有了大語言模型,它可以理解世界,知道這是水,只要有足夠多的數(shù)據(jù),就不用再寫規(guī)則代碼,而是通過各種方式去獲得更多的數(shù)據(jù)進(jìn)行訓(xùn)練。這也是為什么“具身智能”一下火起來了。 

問:獵戶星空服務(wù)機(jī)器人在海外市場(chǎng)主要的應(yīng)用場(chǎng)景是哪些?中國(guó)的機(jī)器人產(chǎn)品出海要進(jìn)一步克服哪些困難?

傅盛:目前獵戶星空機(jī)器人主要還是遞送類,在餐廳送餐、回盤,也有一些交互類的,去做講解、引導(dǎo)等工作。

海外需求相對(duì)旺盛,因?yàn)榘l(fā)達(dá)國(guó)家勞動(dòng)力比較貴,而且稀缺。要進(jìn)一步打開市場(chǎng),就得用大模型把它智能化。

我們?cè)诤M庥龅搅艘恍﹩栴},也在慢慢克服。早期部署成本很高,不僅機(jī)器人過去,也要讓商家會(huì)用。我們未來的目標(biāo)是實(shí)現(xiàn)“開箱即用”,機(jī)器人做到這個(gè)并不容易,它得認(rèn)識(shí)環(huán)境。以前需要人去給它建圖,現(xiàn)在有了大語言模型,這件事的難度會(huì)大幅度降低,甚至可以實(shí)現(xiàn)自動(dòng)化。 

另一個(gè)問題是交互能力。我們?cè)诤M庖恢睕]有做交互,因?yàn)槊總€(gè)國(guó)家語言不同,還得做定制,非常復(fù)雜。而大語言模型天然就是翻譯機(jī),像獵戶星空大模型(Orion-14B)的日語能力在開源模型里是比較好的,因?yàn)槲覀冋J(rèn)真訓(xùn)練了一下日語。最神奇的是,你都不用管它,只要把日語輸出給它,它自然就會(huì)了,而且會(huì)翻譯。這放以前也是一種顛覆,是它的天然能力。機(jī)器人未來要把智能化再提高,拓展它的應(yīng)用場(chǎng)景。

我雖然不看好人形機(jī)器人,但覺得機(jī)械臂去做一些動(dòng)作是可以的。我們下半年會(huì)有機(jī)械臂方面的產(chǎn)品推出,因?yàn)樗谀承﹫?chǎng)景下能夠?qū)崿F(xiàn)一定的任務(wù)。 

問:SaaS在中國(guó)差不多被驗(yàn)證是失敗的,獵豹現(xiàn)在做私有化大模型,會(huì)不會(huì)也會(huì)面臨企業(yè)付費(fèi)意愿低的問題?畢竟現(xiàn)在AI應(yīng)用還沒有產(chǎn)生多少收入,包括國(guó)外也是。

傅盛:是的。我們現(xiàn)在在和頭部的企業(yè)合作,一期已經(jīng)在交付,二期正在做,我們認(rèn)為是有可能標(biāo)準(zhǔn)化的。

中國(guó)的市場(chǎng)我可能改變不了,但只要做好,讓企業(yè)都能滿意,我們就把它標(biāo)準(zhǔn)化,下一步再出海去做。出海本就是我們的基因,很多海外客戶也愿意接受(私有化大模型)。海外市場(chǎng)足夠大,愿意付費(fèi)。經(jīng)過中國(guó)市場(chǎng)驗(yàn)證的產(chǎn)品模式,現(xiàn)在到全球都是有競(jìng)爭(zhēng)力的。 

問:你覺得窗口期大概有多久?

傅盛:最多就到年底,一步一步來,我用更長(zhǎng)的時(shí)間來看這件事情時(shí),思路就會(huì)不太一樣,現(xiàn)在就是盯效果,真要說多拿幾單進(jìn)來也不是不能。

問:在獵戶星空這邊,你的精力主要放在產(chǎn)品這塊嗎?

傅盛:現(xiàn)在是,銷售上我也得花精力。我后來意識(shí)到,ToB和ToC最大的不同,就是ToB銷售本身就是一個(gè)產(chǎn)品化的過程。

比如說私有化大模型跟做ToC不一樣,做ToC我自己覺得這個(gè)產(chǎn)品不錯(cuò),不需要ToB。但是ToB必須要了解客戶,這對(duì)我們以前做ToC的團(tuán)隊(duì)來講是個(gè)挑戰(zhàn),這兩年慢慢積累了一些經(jīng)驗(yàn),學(xué)了不少。

問:這種業(yè)務(wù)收入規(guī)模的提升,大概是一條什么樣的曲線?有所謂爆發(fā)節(jié)點(diǎn)嗎?

傅盛:ToB的肯定不會(huì)那么快,前幾年其實(shí)還在水平線上,今年開始產(chǎn)品化,能再做好一些。大語言模型是讓整個(gè)機(jī)器人場(chǎng)景發(fā)生了很大的拓展。我今天展示的講解、直播機(jī)器人,以前是很難實(shí)現(xiàn)的,現(xiàn)在能做到接近于人的水平,明年它的增長(zhǎng)可能會(huì)比較大。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

獵豹移動(dòng)

105
  • 四魯企登胡潤(rùn)全球“獵豹榜”
  • 68家粵港澳大灣區(qū)公司入選2024胡潤(rùn)全球獵豹企業(yè)榜

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

對(duì)話獵豹移動(dòng)傅盛:“大”模型不是通往AGI的唯一路徑

“我們可能真的不會(huì)遇到一種‘萬能’技術(shù),所有的技術(shù)最后都要跟不同的場(chǎng)景結(jié)合。即便有這樣的能力,還要考慮成本?!?/p>

圖片來源:獵豹移動(dòng)

界面新聞?dòng)浾?| 伍洋宇

界面新聞編輯 | 宋佳楠

8月21日,2024世界機(jī)器人大會(huì)期間,作為獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng),傅盛就AGI(通用人工智能)、具身智能、大模型機(jī)器人等話題進(jìn)行了演講。

傅盛表示,自己在AI 1.0時(shí)代便看到了機(jī)器人將從傳統(tǒng)的工業(yè)場(chǎng)景走到服務(wù)業(yè)場(chǎng)景,乃至千家萬戶的機(jī)會(huì),因此于七年前投資創(chuàng)辦了獵戶星空。

而在進(jìn)階程度更高的AI 2.0時(shí)代,他用“人類科技史上的奇跡年”來形容人工智能的這波崛起,認(rèn)為可與牛頓的“萬有引力”或是愛因斯坦“相對(duì)論”的出現(xiàn)相提并論。在他看來,大語言模型帶來的端到端創(chuàng)新范式的影響,對(duì)全行業(yè)、全社會(huì)都會(huì)產(chǎn)生巨大改變。

受益于ChatGPT在語義理解方面實(shí)現(xiàn)的能力突破,機(jī)器人也迎來更多發(fā)展機(jī)會(huì),因?yàn)椤?/span>語言實(shí)際上是人類真正獨(dú)立于其它物種的核心智能”。 

“智能涌現(xiàn)”的整個(gè)過程可謂“神奇”。用AI教母李飛飛的話來說,“大模型是個(gè)灰盒”。伴隨著各種不確定性,OpenAI率先走出一條與眾不同的道路,且實(shí)現(xiàn)了創(chuàng)新。

但傅盛指出,大語言模型并不一定是通往AGI的唯一道路。他贊同Meta首席科學(xué)家楊立昆的觀點(diǎn):大語言模型的天然結(jié)構(gòu)使得它很難實(shí)現(xiàn)AGI。

其中有兩方面考量因素,一是更小參數(shù)的大模型是否同樣可以實(shí)現(xiàn)智能;另一方面,不是所有工作都需要AGI這樣的“愛因斯坦”,整個(gè)社會(huì)是一個(gè)金字塔形的多元結(jié)構(gòu),基層需要更多平民化的大模型出現(xiàn)。

當(dāng)前,OpenAI、蘋果、微軟等科技巨頭都在以實(shí)際行動(dòng)驗(yàn)證“小模型”趨勢(shì),這可能讓大模型直接成為端的一部分,而不只是在云上。

今年1月,獵戶星空也曾發(fā)布小參數(shù)模型Orion-14B。除了考慮大參數(shù)模型的成本昂貴之外,這家公司認(rèn)為,機(jī)器人一定要在端上跑自己的模型,才可能既解決數(shù)據(jù)隱私問題,又做到實(shí)時(shí)快速響應(yīng)。 

傅盛表示,端模一體帶來的產(chǎn)品和科技變革的意義將更大,會(huì)直接引發(fā)交互革命和生產(chǎn)力革命,而大模型機(jī)器人是獵戶星空所押注的賽道。目前,該公司將其分為勞動(dòng)協(xié)作機(jī)器人、接待營(yíng)銷機(jī)器人和遞送配貨機(jī)器人三類。

就大模型私有化部署而言,傅盛稱自己不僅要負(fù)責(zé)產(chǎn)品,也對(duì)銷售投入了大量精力。他發(fā)現(xiàn),ToB(企業(yè)端)的銷售本身就是一個(gè)產(chǎn)品化過程。

在他看來,這項(xiàng)業(yè)務(wù)的收入表現(xiàn)不會(huì)是一條很陡峭的曲線,甚至過去幾年經(jīng)歷過近乎水平的進(jìn)程。但由于大模型的介入,明年產(chǎn)業(yè)規(guī)??赡軙?huì)有明顯變化。

演講結(jié)束后,傅盛接受了界面新聞等媒體采訪,對(duì)AGI實(shí)現(xiàn)路徑、小模型趨勢(shì)、端模一體、雙足機(jī)器人的未來等熱門話題,給出了自己的看法。

以下為采訪實(shí)錄,略作編輯:

問:你說大語言模型不是AGI的唯一路徑,所指的到底是Scaling law不行,還是Transformer架構(gòu)不行?

傅盛:對(duì)于Scaling law到底行不行,大家都有自己的看法。我看谷歌一位研究員說,現(xiàn)在大語言模型遇到了瓶頸,標(biāo)志性事件就是GPT-5發(fā)不出來。OpenAI作為一家科技創(chuàng)業(yè)公司,18個(gè)月沒有發(fā)自己的旗艦產(chǎn)品,而是忙著做Search GPT,或者GPT-4o,說明要么是卡著上不去,要么是訓(xùn)練出的效果不太好,沒有質(zhì)的提升。

硅谷都在盯著GPT-5到底何時(shí)出來,出來后是不是有大的提升。如果沒有提升,可能會(huì)有點(diǎn)類似出現(xiàn)互聯(lián)網(wǎng)泡沫的感覺。

我也不知道到底是Scaling law不行,還是Transformer架構(gòu)不行。做大語言模型就是一個(gè)嘗試的過程。OpenAI有技術(shù)信仰,他們堅(jiān)信這事,靠一個(gè)ChatGPT活過來了。但今天到底為什么這樣,以后它的Scaling law能走到什么地方,沒有原理去證明。此外,新的數(shù)據(jù)從哪里來也是個(gè)問題。

問:從GPT-4o mini和Apple intelligence來看,小模型可能是趨勢(shì)。你認(rèn)為端模一體最考驗(yàn)企業(yè)的是什么?這個(gè)能力現(xiàn)在中美有明顯差距嗎?

傅盛:小模型已經(jīng)不斷被驗(yàn)證了。技術(shù)發(fā)展到這一步,一個(gè)幾十億參數(shù)的模型能力已經(jīng)不錯(cuò)了,蘋果做的所有工作都是在它的小模型上?,F(xiàn)在看起來端上的需求是很大的,無論是手機(jī)、電腦,未來一定是這樣的邏輯。

中美應(yīng)該沒有太大差距。訓(xùn)練小模型對(duì)算力要求低,需要結(jié)合真正的應(yīng)用場(chǎng)景,這方面中國(guó)有自己的優(yōu)勢(shì),迭代快。包括私有化大模型出海,如果不是美國(guó)的大公司在做,那些創(chuàng)業(yè)公司和中國(guó)的效率還是有差距的。

問:1月份時(shí),你曾說過超越OpenAI的機(jī)會(huì)一定來自大模型的應(yīng)用。大半年過去了,現(xiàn)在看到哪些應(yīng)用的機(jī)會(huì)?  

傅盛:那個(gè)時(shí)候,對(duì)于是否做好一個(gè)特別牛的模型就能解決所有問題,大家有很多爭(zhēng)議。今天看起來答案非常明顯,即做好一個(gè)模型也不能解決大多數(shù)問題。學(xué)界也在討論,大語言模型到底能不能實(shí)現(xiàn)AGI?去年大家都信心滿滿,現(xiàn)在很多人覺得不太可能,它只是一個(gè)更好用的工具而已。 

我們可能真的不會(huì)遇到一種“萬能”技術(shù),所有的技術(shù)最后都要跟不同的場(chǎng)景結(jié)合。即便有這樣的能力,還要考慮成本。比如你要取暖,最簡(jiǎn)單的就是燒柴火,而不是建一個(gè)熱力站,不同場(chǎng)景中大家的需求不一樣。

今天可見之處都是應(yīng)用的機(jī)會(huì),只是有些可能不屬于創(chuàng)業(yè)者。比如蘋果發(fā)布了iOS 18,股價(jià)最高上漲10%。你把手機(jī)改造一下可能有機(jī)會(huì),但只要手機(jī)廠商自己干,你就沒機(jī)會(huì)。

機(jī)器人也是一個(gè)很大的應(yīng)用。雖然我對(duì)雙足機(jī)器人商業(yè)化不看好,但對(duì)機(jī)器人這個(gè)行業(yè)的發(fā)展充滿了信心。

大語言模型出來之前,讓機(jī)器人拿杯子是個(gè)世界級(jí)難題,當(dāng)時(shí)大家都是絕望的,認(rèn)為不可能做成。但今天有了大語言模型,它自己具備了規(guī)劃、判斷和模糊的體驗(yàn),能讓機(jī)器人成為很重要的產(chǎn)品載體。 

問:為什么不看好雙足機(jī)器人商業(yè)化?

傅盛:技術(shù)過于復(fù)雜。雙足機(jī)器人必須依賴于機(jī)械結(jié)構(gòu),但結(jié)構(gòu)不是摩爾定律支撐的,每年能改一點(diǎn)點(diǎn)就不錯(cuò)了。就像汽車剎車系統(tǒng)、底盤,一百年過去了,改了多少?

雙足機(jī)器人進(jìn)展比較慢,今天是電機(jī)問題,明天也是,最多電機(jī)大一點(diǎn)。為了雙足犧牲了太多,包括產(chǎn)品的能耗和穩(wěn)定性。雙足機(jī)器人要解決摔倒的問題,而人的穩(wěn)定性相當(dāng)高。

再者是成本,用幾個(gè)電機(jī)和輪子相比,它成本一定高,還要保證在99%以上的場(chǎng)景不能出錯(cuò)。

作為一個(gè)研究方向是可以的,但說現(xiàn)在雙足機(jī)器人要大行其道,我不看好。每個(gè)人的夢(mèng)想都值得鼓勵(lì),但還得看能不能真正量產(chǎn),以及量產(chǎn)以后市場(chǎng)的接受程度。

問:雙足機(jī)器人做科研的這幾年,主要是解決哪些問題?

傅盛:結(jié)構(gòu)的靈活性問題以及算法問題。膝蓋是非常復(fù)雜的,有各種肌肉、小關(guān)節(jié),還有很好的力反饋,再借助大腦、小腦,才能讓我們站立。雙足機(jī)器人是鋼鐵的東西,沒有這些,只能靠算法。由于端到端,算法的確進(jìn)步很大,像波士頓動(dòng)力以前所有的積累可能都廢了,但難度還是挺大的。 

問:如果三五年之后,它們真的能落到產(chǎn)線上,會(huì)改變你的看法嗎?

傅盛:不會(huì),因?yàn)槟隳苈湓诋a(chǎn)業(yè)上,我一個(gè)輪子的結(jié)構(gòu)也能落,而且永遠(yuǎn)比你便宜100倍以上。今天你花20萬買輛汽車,一下能開出去100公里。有一天來了一匹機(jī)械馬,需要100多萬,你買車還是買馬?車就是這么打敗馬的。

機(jī)器人用輪子很有優(yōu)勢(shì),等到有一天產(chǎn)品真正穩(wěn)定的時(shí)候,其實(shí)干活是用上半肢。

問:有一些雙足或者人形機(jī)器人的研報(bào),會(huì)說現(xiàn)在處在人形機(jī)器人的“前夜”,你是否認(rèn)同這樣的觀點(diǎn)?

傅盛:去年(特斯拉)“擎天柱”出來的時(shí)候,很多投資人都很受震動(dòng)。當(dāng)時(shí)特斯拉放話,再過一兩年,能達(dá)到幾萬臺(tái)或者10萬臺(tái)的規(guī)模。當(dāng)時(shí)我說不可能,今天話就放在這。

之前特斯拉說明年會(huì)有1000臺(tái)“擎天柱”進(jìn)入工廠,但我認(rèn)為它們做不到很好地工作。以特斯拉的實(shí)力,放1000臺(tái)去測(cè)試是可以的。

一些企業(yè)講人形機(jī)器人產(chǎn)線搬運(yùn),這完全是作秀,搬運(yùn)為什么不用叉車?用加機(jī)械臂的叉車不行嗎?一個(gè)輪子能拉100公斤,人形機(jī)器人搬運(yùn)兩公斤就不禁摔,更別說造價(jià)多少。

現(xiàn)在離“前夜”很遠(yuǎn)很遠(yuǎn)。2017年,我的團(tuán)隊(duì)就拿機(jī)器人點(diǎn)蠟燭,好多機(jī)械臂廠商也說要改變行業(yè),后來發(fā)現(xiàn)這個(gè)行業(yè)真的很難改變,因?yàn)闄C(jī)械結(jié)構(gòu)是一點(diǎn)點(diǎn)磨出來的。不能因?yàn)榘B ゑR斯克做了這個(gè)事就覺得一定行。人都有驕傲的時(shí)候,他也不例外,沒有神嘛。 

問:大模型機(jī)器人是怎樣一個(gè)概念?

傅盛:有點(diǎn)“具身智能”的概念。大模型通過語言的學(xué)習(xí)構(gòu)建了對(duì)這個(gè)世界的基本邏輯和認(rèn)知。大語言模型可以做出規(guī)劃,反饋給人,這比以前(做機(jī)器人)的技術(shù)難度要低很多,要知道以前所有的移動(dòng)都得寫控制代碼,寫起來很費(fèi)勁。 

大模型是實(shí)現(xiàn)具身智能的推動(dòng)力,是一個(gè)基礎(chǔ)條件。在沒有大模型之前,(機(jī)器)理解世界是不可想象的。 

問:這個(gè)概念為什么這兩年才火起來,它和之前的那些智能化的機(jī)器人傳感器等有什么不同?

傅盛:之前的很多智能化可以理解成一種程序化的過程,比如先幫你預(yù)設(shè)好,看了一個(gè)什么東西去點(diǎn)一下,這已經(jīng)算很高級(jí)了。最早的都不需要交互,自動(dòng)化完全匹配,這是第一階段。

第二階段有一定判別的技能,我們叫做“規(guī)則”。規(guī)則很難容納太多的東西,比如突然出現(xiàn)一杯水,但(代碼)沒寫就傻了。有了大語言模型,它可以理解世界,知道這是水,只要有足夠多的數(shù)據(jù),就不用再寫規(guī)則代碼,而是通過各種方式去獲得更多的數(shù)據(jù)進(jìn)行訓(xùn)練。這也是為什么“具身智能”一下火起來了。 

問:獵戶星空服務(wù)機(jī)器人在海外市場(chǎng)主要的應(yīng)用場(chǎng)景是哪些?中國(guó)的機(jī)器人產(chǎn)品出海要進(jìn)一步克服哪些困難?

傅盛:目前獵戶星空機(jī)器人主要還是遞送類,在餐廳送餐、回盤,也有一些交互類的,去做講解、引導(dǎo)等工作。

海外需求相對(duì)旺盛,因?yàn)榘l(fā)達(dá)國(guó)家勞動(dòng)力比較貴,而且稀缺。要進(jìn)一步打開市場(chǎng),就得用大模型把它智能化。

我們?cè)诤M庥龅搅艘恍﹩栴},也在慢慢克服。早期部署成本很高,不僅機(jī)器人過去,也要讓商家會(huì)用。我們未來的目標(biāo)是實(shí)現(xiàn)“開箱即用”,機(jī)器人做到這個(gè)并不容易,它得認(rèn)識(shí)環(huán)境。以前需要人去給它建圖,現(xiàn)在有了大語言模型,這件事的難度會(huì)大幅度降低,甚至可以實(shí)現(xiàn)自動(dòng)化。 

另一個(gè)問題是交互能力。我們?cè)诤M庖恢睕]有做交互,因?yàn)槊總€(gè)國(guó)家語言不同,還得做定制,非常復(fù)雜。而大語言模型天然就是翻譯機(jī),像獵戶星空大模型(Orion-14B)的日語能力在開源模型里是比較好的,因?yàn)槲覀冋J(rèn)真訓(xùn)練了一下日語。最神奇的是,你都不用管它,只要把日語輸出給它,它自然就會(huì)了,而且會(huì)翻譯。這放以前也是一種顛覆,是它的天然能力。機(jī)器人未來要把智能化再提高,拓展它的應(yīng)用場(chǎng)景。

我雖然不看好人形機(jī)器人,但覺得機(jī)械臂去做一些動(dòng)作是可以的。我們下半年會(huì)有機(jī)械臂方面的產(chǎn)品推出,因?yàn)樗谀承﹫?chǎng)景下能夠?qū)崿F(xiàn)一定的任務(wù)。 

問:SaaS在中國(guó)差不多被驗(yàn)證是失敗的,獵豹現(xiàn)在做私有化大模型,會(huì)不會(huì)也會(huì)面臨企業(yè)付費(fèi)意愿低的問題?畢竟現(xiàn)在AI應(yīng)用還沒有產(chǎn)生多少收入,包括國(guó)外也是。

傅盛:是的。我們現(xiàn)在在和頭部的企業(yè)合作,一期已經(jīng)在交付,二期正在做,我們認(rèn)為是有可能標(biāo)準(zhǔn)化的。

中國(guó)的市場(chǎng)我可能改變不了,但只要做好,讓企業(yè)都能滿意,我們就把它標(biāo)準(zhǔn)化,下一步再出海去做。出海本就是我們的基因,很多海外客戶也愿意接受(私有化大模型)。海外市場(chǎng)足夠大,愿意付費(fèi)。經(jīng)過中國(guó)市場(chǎng)驗(yàn)證的產(chǎn)品模式,現(xiàn)在到全球都是有競(jìng)爭(zhēng)力的。 

問:你覺得窗口期大概有多久?

傅盛:最多就到年底,一步一步來,我用更長(zhǎng)的時(shí)間來看這件事情時(shí),思路就會(huì)不太一樣,現(xiàn)在就是盯效果,真要說多拿幾單進(jìn)來也不是不能。

問:在獵戶星空這邊,你的精力主要放在產(chǎn)品這塊嗎?

傅盛:現(xiàn)在是,銷售上我也得花精力。我后來意識(shí)到,ToB和ToC最大的不同,就是ToB銷售本身就是一個(gè)產(chǎn)品化的過程。

比如說私有化大模型跟做ToC不一樣,做ToC我自己覺得這個(gè)產(chǎn)品不錯(cuò),不需要ToB。但是ToB必須要了解客戶,這對(duì)我們以前做ToC的團(tuán)隊(duì)來講是個(gè)挑戰(zhàn),這兩年慢慢積累了一些經(jīng)驗(yàn),學(xué)了不少。

問:這種業(yè)務(wù)收入規(guī)模的提升,大概是一條什么樣的曲線?有所謂爆發(fā)節(jié)點(diǎn)嗎?

傅盛:ToB的肯定不會(huì)那么快,前幾年其實(shí)還在水平線上,今年開始產(chǎn)品化,能再做好一些。大語言模型是讓整個(gè)機(jī)器人場(chǎng)景發(fā)生了很大的拓展。我今天展示的講解、直播機(jī)器人,以前是很難實(shí)現(xiàn)的,現(xiàn)在能做到接近于人的水平,明年它的增長(zhǎng)可能會(huì)比較大。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。