文|數(shù)智前線 徐鑫
編輯|任曉漁
大模型的世界不缺熱點(diǎn)。
近日,OpenAI發(fā)布的Sora大模型引爆科技圈,大模型能力又一次迎來(lái)炸裂更新。而在底層大模型技術(shù)快速迭代之外,過(guò)去大半年里行業(yè)內(nèi)的最熱門(mén)話(huà)題當(dāng)屬AI Agent。
這也是個(gè)分歧和共識(shí)并存的領(lǐng)域,引發(fā)了從巨頭到創(chuàng)業(yè)者和投資圈的共同關(guān)注。
分歧在于,到底什么才算Agent,人們的認(rèn)知不一。比如OpenAI官方推出的GPTS到底算不算Agent,到底是自動(dòng)化還是輔助式協(xié)作,人們看法有差別。另外,中文里它還有“代理”、“智能體”等不同提法。
而AI巨頭、平臺(tái)企業(yè)和各類(lèi)創(chuàng)業(yè)公司用行動(dòng)表達(dá)了對(duì)這一領(lǐng)域的看好,積極布局Agent開(kāi)發(fā)平臺(tái)、框架或應(yīng)用。OpenAI無(wú)疑是風(fēng)向標(biāo)。OpenAI CEO山姆·奧特曼稱(chēng),未來(lái)各行各業(yè),每個(gè)人都可以擁有AI Agent。去年11月OpenAI發(fā)布自定義GPT,到今年1月GPT Store正式上線時(shí),據(jù)稱(chēng)該平臺(tái)已經(jīng)有了超300萬(wàn)個(gè)GPTs。比爾蓋茨還發(fā)長(zhǎng)文指出,AI Agent將徹底改變?nèi)藗兪褂糜?jì)算機(jī)的方式。
在國(guó)內(nèi),百度、阿里、字節(jié)、智譜等一眾企業(yè)都推出了各類(lèi)Agent平臺(tái),也有不少企業(yè)從應(yīng)用層發(fā)力,如360、瀾碼科技、實(shí)在智能等從安全、財(cái)務(wù)、人事等場(chǎng)景探索Agent落地。
Agent為什么會(huì)成為香餑餑?國(guó)內(nèi)企業(yè)目前是如何切入Agent賽道?創(chuàng)業(yè)公司和平臺(tái)企業(yè)的優(yōu)劣勢(shì)是什么?Agent距離真正改變生產(chǎn)生活,還有多遠(yuǎn)?
01、大佬都愛(ài)Agent
2024年被業(yè)界視作Agent落地元年。
上個(gè)月的2024CES上,被問(wèn)及2024年AI領(lǐng)域可能有哪些重大突破時(shí),吳恩達(dá)回答,大型語(yǔ)言模型到大型視覺(jué)模型的轉(zhuǎn)變,自動(dòng)化智能體(autonomous agents )的崛起和邊緣智能。
新年伊始,文生視頻大模型Sora的爆火,視覺(jué)模型技術(shù)已迎來(lái)突破,這也讓業(yè)界頗為期待Agent的應(yīng)用和落地。
實(shí)際上過(guò)去大半年,Agent在大模型里的火爆有目共睹。去年下半年時(shí),硅谷科技記者M(jìn)att Schlicht統(tǒng)計(jì)稱(chēng),至少有100個(gè)項(xiàng)目在將Agent商業(yè)化。據(jù)一家投資機(jī)構(gòu)不完全統(tǒng)計(jì),他們觀察到去年下半年有二十多個(gè)Agent項(xiàng)目完成融資。
也有人稱(chēng),去年年中以后,大模型賽道上創(chuàng)業(yè)者和投資人的關(guān)注點(diǎn)一下子從模型本身轉(zhuǎn)移到了Agent上。
而如果追溯當(dāng)下這波Agent 熱潮,不少人把去年三月底開(kāi)始刷屏的AutoGPT視作開(kāi)始。作為一個(gè)開(kāi)源項(xiàng)目,AutoGPT創(chuàng)造了Github上的星標(biāo)上漲記錄。它由大語(yǔ)言模型驅(qū)動(dòng)。用戶(hù)用自然語(yǔ)言設(shè)定目標(biāo),AutoGPT能自動(dòng)將目標(biāo)分解成子任務(wù),連接互聯(lián)網(wǎng)或使用其他工具來(lái)實(shí)現(xiàn)目標(biāo)。
與ChatGPT不同,用戶(hù)使用AutoGPT時(shí)不需要頻繁提問(wèn),只需要給AutoGPT設(shè)定一個(gè)一個(gè)AI名稱(chēng)、描述和目標(biāo),它就能自己完成項(xiàng)目。這一項(xiàng)目很快就在GitHub上成為頂流。
而Agent爆火也離不開(kāi)AI巨頭OpenAI 的添磚加瓦。
2023年年中,當(dāng)時(shí)還是OpenAI聯(lián)合創(chuàng)始人的Andrew Karpathy在一個(gè)開(kāi)發(fā)者活動(dòng)的發(fā)言被廣為傳播。“如果一篇論文提出了某種不同的訓(xùn)練方法,OpenAI內(nèi)部會(huì)嗤之以鼻,認(rèn)為都是我們玩剩下的。但是當(dāng)新的AI Agent論文出來(lái)時(shí),我們會(huì)十分認(rèn)真且興奮地討論”。
Andrew Karpathy還指出,普通人、創(chuàng)業(yè)者和極客在構(gòu)建AI Agents方面相比OpenAI這樣的公司更有優(yōu)勢(shì)。
也是這一時(shí)間段,OpenAI 應(yīng)用研發(fā)主管Lilian weng 在一篇博文里定義了基于LLM構(gòu)建AI Agents的框架。她指出,Agent=LLM(大型語(yǔ)言模型)+記憶(Memory)+規(guī)劃技能(Planning)+工具使用(Tool Use),其中,LLM是智能體的大腦,而記憶、規(guī)劃和工具使用能力是關(guān)鍵組件。它也成為大模型時(shí)代Agent的經(jīng)典定義。
到2023年11月,OpenAI DevDay上,OpenAI推出其官方Agent開(kāi)發(fā)框架Assistant API,并宣布將推出GPT Store,Agent熱潮進(jìn)一步發(fā)酵。
同一時(shí)間段,比爾蓋茨寫(xiě)了一篇長(zhǎng)文看多Agent領(lǐng)域。他預(yù)言五年內(nèi),Agent將改變?nèi)藗兪褂秒娔X的方式,顛覆軟件產(chǎn)業(yè)。除了OpenAI和各路大佬動(dòng)向不斷,硅谷還涌現(xiàn)了大量的AI Agent創(chuàng)業(yè)項(xiàng)目或產(chǎn)品,比如BabyAGI、MetaGPT、GPT Researcher等。據(jù)云基礎(chǔ)設(shè)施服務(wù)商E2B的不完全統(tǒng)計(jì)和分類(lèi),在編程、個(gè)人助手、生產(chǎn)力、財(cái)務(wù)等多個(gè)細(xì)分場(chǎng)景都有大量的開(kāi)源和閉源項(xiàng)目。
巨頭微軟也推出了多類(lèi)Agent 架構(gòu),以代碼為中心的TaskWeaver,還有多Agent 框架 AutoGen。英偉達(dá)的研究人員則利用ChatGPT技術(shù)制作了一個(gè)智能體Voyager,它會(huì)自己玩《我的世界》,能完成游泳、采集植物、獵豬、開(kāi)采金礦、建造房屋等操作。
除了單智能體類(lèi)應(yīng)用,還有多智能體類(lèi)項(xiàng)目。最知名的多智能體項(xiàng)目當(dāng)屬斯坦福大學(xué)和谷歌合作的斯坦福小鎮(zhèn)(Smallville )開(kāi)源實(shí)驗(yàn)。在這個(gè)實(shí)驗(yàn)中,研究人員創(chuàng)建了一個(gè)由25名智能體組成的虛擬小鎮(zhèn),并讓其中一個(gè)策劃一個(gè)情人節(jié)派對(duì)。這些智能體能彼此交流,按照設(shè)定做出相應(yīng)的決策。
02、什么是Agent,為什么成為香餑餑?
從大佬到創(chuàng)業(yè)公司紛紛看好Agent,首先在于它延展了大模型的能力。
一位人工智能領(lǐng)域資深技術(shù)觀察者介紹,當(dāng)下,Agent的記憶、規(guī)劃以及使用工具的能力都是在彌補(bǔ)大模型現(xiàn)在還比較弱的地方。Agent本質(zhì)是以大模型為核心,擴(kuò)展大模型的潛力,目標(biāo)是成為強(qiáng)大的通用問(wèn)題解決方案。
網(wǎng)易數(shù)帆CodeWave產(chǎn)品技術(shù)負(fù)責(zé)人就告訴數(shù)智前線,其實(shí)不用把Agent想得太復(fù)雜,它表現(xiàn)出來(lái)就像自動(dòng)化操作,底層還是基于大模型的能力。OpenAI官方定義的它的幾大能力里,比如使用工具,調(diào)用搜索引擎,外接數(shù)據(jù)或第三方API,實(shí)際上增強(qiáng)了大模型的能力。
致遠(yuǎn)互聯(lián)高級(jí)副總裁蔣蜀革則判斷,在企業(yè)級(jí)場(chǎng)景里應(yīng)用中,Agent跟大模型的落地高度關(guān)聯(lián)的。蔣蜀革認(rèn)為,目前業(yè)界已經(jīng)很務(wù)實(shí),非常理性看待大模型的能力,光靠大模型落不了地。比如企業(yè)的數(shù)據(jù)、規(guī)則、業(yè)務(wù)上下文都非常重要,當(dāng)下大語(yǔ)言模型提供不了外部的實(shí)時(shí)信息,也無(wú)法訪問(wèn)內(nèi)部數(shù)據(jù),這很難支撐企業(yè)內(nèi)場(chǎng)景的應(yīng)用?!岸鳤gent 能夠感知環(huán)境,感知上下文,自己做業(yè)務(wù)規(guī)劃,結(jié)合企業(yè)的數(shù)據(jù)、知識(shí)、企業(yè)的業(yè)務(wù)系統(tǒng)去走。這個(gè)落地的框架是越來(lái)越清晰的?!?/p>
也有人把大模型比喻成大腦,而Agent的能力則讓它多了四肢。實(shí)在智能的算法負(fù)責(zé)人歐陽(yáng)認(rèn)為,大模型和Agent的最大區(qū)別就在于Agent對(duì)于工具的使用,Agent是大模型進(jìn)一步落地的必然選擇,比如在智能客服、文案的生成類(lèi)任務(wù)時(shí),大語(yǔ)言模型本質(zhì)上還是在意圖理解和對(duì)話(huà)生成的能力,但在真正的企業(yè)應(yīng)用場(chǎng)景里,對(duì)話(huà)類(lèi)任務(wù)只占日常工作中比較少的一部分。
許多工種需要操作各類(lèi)業(yè)務(wù)系統(tǒng),完成指定業(yè)務(wù)流程。比如財(cái)務(wù)要操作財(cái)務(wù)類(lèi)軟件,完成報(bào)稅報(bào)銷(xiāo)和財(cái)務(wù)稽核工作;而法務(wù)要審核很多合同,起草法務(wù)文件,這些都要跟大量的業(yè)務(wù)系統(tǒng)打交道?!霸谶@些場(chǎng)景里,只有大模型,相當(dāng)于有一個(gè)非常智能的大腦,但是它沒(méi)有沒(méi)有手腳去真正操作,因此大模型和各類(lèi)自動(dòng)化工具,例如RPA(機(jī)器人流程自動(dòng)化)等,就存在一個(gè)很好的結(jié)合點(diǎn)”,歐陽(yáng)說(shuō)。
另外,業(yè)界也看中Agent能夠與環(huán)境互動(dòng)的能力,它能理解目標(biāo),拆解任務(wù),并且調(diào)用工具執(zhí)行任務(wù)。原來(lái)一些步驟和流程無(wú)法按照一個(gè)復(fù)雜的任務(wù)線來(lái)串起來(lái),Agent以大語(yǔ)言模型作為一切任務(wù)的中心,就可以處理復(fù)雜的任務(wù)了。
瀾碼科技創(chuàng)始人兼CEO周健認(rèn)為,傳統(tǒng)的軟件需要人去適應(yīng)機(jī)器,Agent最核心的特點(diǎn)是它能對(duì)環(huán)境有感知,并且跟環(huán)境互動(dòng)。以RPA為例,作為傳統(tǒng)的自動(dòng)化工具,RPA能實(shí)現(xiàn)某些步驟的自動(dòng)化作業(yè),但這些能被自動(dòng)化的步驟非常有限。只要該步驟的業(yè)務(wù)上下文和業(yè)務(wù)理解的規(guī)則上稍微復(fù)雜一點(diǎn),RPA就很難完成。比如金融行業(yè)信貸審核流程可能涉及到上百個(gè)步驟,RPA能夠去自動(dòng)化完成的只有幾個(gè)。
而大模型實(shí)際上提供了極其便利的語(yǔ)言理解能力及推理能力。因?yàn)橛辛苏Z(yǔ)言理解能力,其實(shí)人與機(jī)器的互動(dòng)模式就變得更靈活,機(jī)器可以適應(yīng)人?!澳軌虮蛔詣?dòng)化的業(yè)務(wù)步驟數(shù)量大大增加,能形成規(guī)?;纳a(chǎn)力?!敝芙≌f(shuō)。
正如比爾蓋茨認(rèn)為,Agent未來(lái)會(huì)變成一個(gè)非常普遍的存在,改變?nèi)藗兪褂秒娔X的方式,顛覆軟件行業(yè),也有不少行業(yè)人士認(rèn)為,Agent正在引發(fā)人和機(jī)器互動(dòng)的范式變遷。
一位大廠技術(shù)高管認(rèn)為,新范式變遷下,總會(huì)帶來(lái)平臺(tái)級(jí)的機(jī)會(huì)和新的入口,這其實(shí)會(huì)給很多創(chuàng)業(yè)公司帶來(lái)新的機(jī)會(huì)。這也是從行業(yè)巨頭到創(chuàng)業(yè)者及投資市場(chǎng)普遍比較興奮的原因。
03、國(guó)內(nèi)企業(yè)動(dòng)作頻頻
范式變遷的潛在機(jī)遇也吸引了國(guó)內(nèi)的一大批企業(yè),大廠、AI公司和新興創(chuàng)業(yè)團(tuán)隊(duì)都積極布局這一賽道。
根據(jù)數(shù)據(jù)前線不完全統(tǒng)計(jì),目前不同角色進(jìn)入市場(chǎng)的布局重點(diǎn)不一。
一類(lèi)是平臺(tái)模式。手持自研大模型的廠商如阿里和百度都推出了智能體開(kāi)發(fā)平臺(tái)。阿里達(dá)摩院的魔搭社區(qū)推出ModelScopeGPT,百度的靈境矩陣平臺(tái)全新升級(jí)為文心大模型智能體平臺(tái)。對(duì)這兩家既有自研大模型,同時(shí)有云計(jì)算業(yè)務(wù)的企業(yè)而言,培育和完善Agent的開(kāi)發(fā)者生態(tài)符合其定位和需求。
也有一眾企業(yè)對(duì)標(biāo)OpenAI的GPT Store,面向更廣泛人群,推出可快速生成Agent的智能體商店,比如昆侖萬(wàn)維、釘釘、智譜AI、字節(jié)等。面向泛C端市場(chǎng)推出智能體商店,看中的自然是Agent的入口屬性和對(duì)應(yīng)用生態(tài)的變革。釘釘總裁葉軍在釘釘7.5版本發(fā)布會(huì)上就斷言,AI Agent已經(jīng)成為當(dāng)下最佳AI應(yīng)用入口,釘釘?shù)哪繕?biāo)是成為低門(mén)檻、高頻和開(kāi)放的AI助理平臺(tái),他還表示,未來(lái)三年,要有1000萬(wàn)個(gè)AI助理在釘釘上產(chǎn)生。
頭部云廠商里,手握自研大模型的企業(yè)還有華為和騰訊,這兩家企業(yè)在Agent領(lǐng)域也有動(dòng)作。它們的技術(shù)研究團(tuán)隊(duì)分別都聯(lián)合大學(xué)發(fā)表了專(zhuān)門(mén)的論文,發(fā)布了各自的Agent框架。
去年12月,騰訊和德州大學(xué)達(dá)拉斯分校的研究團(tuán)隊(duì)合作開(kāi)發(fā)的名為AppAgent的項(xiàng)目,進(jìn)入公眾視野。該項(xiàng)目希望可以通過(guò)自主學(xué)習(xí)和模仿人類(lèi)的點(diǎn)擊和滑動(dòng)手勢(shì),在手機(jī)上執(zhí)行各種任務(wù),有人稱(chēng)它相當(dāng)于手機(jī)上的智能“按鍵精靈”。而華為方面,華為諾亞方舟實(shí)驗(yàn)室與倫敦大學(xué)學(xué)院(UCL)、牛津大學(xué)的團(tuán)隊(duì)在去年12月底發(fā)表論文,提出了一種通用框架模型盤(pán)古Agent,用于將結(jié)構(gòu)化推理整合到AI Agents中并進(jìn)行學(xué)習(xí)。
除了智能體商店和Agent開(kāi)發(fā)框架上的布局,還有大量企業(yè)從企業(yè)級(jí)Agent應(yīng)用和平臺(tái)層發(fā)力。比如瀾碼科技、實(shí)在智能等廠商都希望幫助企業(yè)構(gòu)建企業(yè)內(nèi)的一站式Agent設(shè)計(jì)、使用和管理平臺(tái),同時(shí)這些企業(yè)也在一些先行場(chǎng)景里打造標(biāo)桿Agent應(yīng)用,形成示范效應(yīng)。
“如果把大模型視作基礎(chǔ)設(shè)施,目前它已經(jīng)在橫向整合,那么上面的PaaS層其實(shí)也會(huì)橫向整合,企業(yè)內(nèi)會(huì)出現(xiàn)一個(gè)Agent中間件的機(jī)會(huì)?!睘懘a科技的CEO周健認(rèn)為。但由于行業(yè)仍然處于早期,這類(lèi)平臺(tái)當(dāng)下的重點(diǎn)則在積極探索企業(yè)內(nèi)應(yīng)用場(chǎng)景,構(gòu)建標(biāo)桿應(yīng)用,進(jìn)而從應(yīng)用層向中間件平臺(tái)建設(shè)發(fā)力。
周健觀察到,目前企業(yè)內(nèi)Agent應(yīng)用最容易切入和落地的,是在財(cái)務(wù)這類(lèi)數(shù)字化程度比較高、有相應(yīng)的國(guó)家標(biāo)準(zhǔn)化規(guī)范的場(chǎng)景,因?yàn)橛斜容^明確的企業(yè)SOP流程規(guī)范或數(shù)據(jù)沉淀。目前瀾碼科技的企業(yè)級(jí)AI Agent和輕應(yīng)用已經(jīng)在一些企業(yè)先行落地應(yīng)用。同時(shí),瀾碼科技也在人事等不同場(chǎng)景尋找與Agent結(jié)合的方式。
也有一些企業(yè)和平臺(tái)在成熟的業(yè)務(wù)板塊里引進(jìn)了基于大模型的Agent能力。比如網(wǎng)易數(shù)帆CodeWave就嘗試將低代碼平臺(tái)和Agent的能力結(jié)合,來(lái)降低低代碼工程師操作平臺(tái)的難度。
該平臺(tái)產(chǎn)品技術(shù)負(fù)責(zé)人介紹,他們的應(yīng)用場(chǎng)景是利用Agent來(lái)完成自然語(yǔ)言輸出邏輯的編寫(xiě)。這是低代碼里應(yīng)用非常高頻,但是非常難操作的一個(gè)功能。一般簡(jiǎn)單的業(yè)務(wù)邏輯,可能需要半個(gè)小時(shí)左右編寫(xiě),復(fù)雜點(diǎn)的需要耗時(shí)半天到一天。目前接入Agent的能力,能自動(dòng)分析用戶(hù)的訴求,并拆解成可執(zhí)行的任務(wù),完成相關(guān)的邏輯編寫(xiě)。用戶(hù)只需確認(rèn)即可,幾分鐘就能完成此前半天到一天的工作。
無(wú)論是平臺(tái)還是創(chuàng)業(yè)團(tuán)隊(duì),都已經(jīng)開(kāi)始啃起了Agent這塊蛋糕。新浪潮下,一位AI行業(yè)資深人士認(rèn)為,Agent能力的落地,尤其在應(yīng)用層,大平臺(tái)和創(chuàng)業(yè)團(tuán)隊(duì)可能站在的是同一個(gè)起跑線,考驗(yàn)不同企業(yè)對(duì)應(yīng)用層能力的挖掘和場(chǎng)景及需求的洞察。
04、Agent落地缺什么?
“大模型能力還在快速發(fā)展,Agent目前是個(gè)在發(fā)展變化的概念,它的形態(tài)還在演進(jìn)中。”一位ToB領(lǐng)域的資深人士告訴數(shù)智前線,整個(gè)賽道正處于早期。
有觀點(diǎn)稱(chēng),Agent本質(zhì)是模型能力專(zhuān)家化,但當(dāng)下它更像是AI的角色扮演,一個(gè)同質(zhì)化基礎(chǔ)大模型,通過(guò)一些Prompt加人設(shè),Agent的行動(dòng)要滿(mǎn)足人設(shè)。Zilliz 合伙人兼產(chǎn)品總監(jiān)郭人通此前在一個(gè)論壇上表示,后期Agent要成為行業(yè)專(zhuān)家,才具備核心價(jià)值。
那么,Agent如何從高中生升級(jí)到大學(xué)生及行業(yè)專(zhuān)家?業(yè)界普遍關(guān)注到領(lǐng)域模型或“世界模型”的重要性。
周健告訴數(shù)智前線,當(dāng)下基于大語(yǔ)言模型的能力,Agent有與人互動(dòng)、驗(yàn)證虛擬環(huán)境的可能性,但是Agent需要不同的領(lǐng)域模型或世界模型,才能完成對(duì)各類(lèi)環(huán)境的建模和互動(dòng)反饋。而這也是各類(lèi)企業(yè)當(dāng)下的的能力差異點(diǎn),比如瀾碼科技就擅長(zhǎng)業(yè)務(wù)流程的世界模型構(gòu)建。
不管是專(zhuān)家知識(shí)還是領(lǐng)域模型建設(shè),那些對(duì)企業(yè)內(nèi)知識(shí)更為重視,有更好沉淀的組織相對(duì)走在前面。近年來(lái),許多企業(yè)重視用數(shù)據(jù)驅(qū)動(dòng)決策,未來(lái)企業(yè)內(nèi)建設(shè)的各類(lèi)指標(biāo)庫(kù)與Agent結(jié)合,有望提升Agent的智能程度。一些指標(biāo)平臺(tái)已經(jīng)看到了空間,數(shù)智前線獲悉比如大數(shù)據(jù)分析和指標(biāo)平臺(tái)kyligence就計(jì)劃朝向Agent方向打造產(chǎn)品。
周健認(rèn)為,除了那些已有的體系化積累,基于經(jīng)驗(yàn)和小數(shù)據(jù)得來(lái)的知識(shí),也是未來(lái)Agent落地必不可少的。例如如何評(píng)估財(cái)務(wù)的健康度,什么叫做應(yīng)收賬款比例過(guò)高,“高”在不同行業(yè)、不同企業(yè)定義和意義并不一樣。過(guò)去各類(lèi)組織較少花精力去數(shù)字化這部分知識(shí),未來(lái)需要補(bǔ)齊。
網(wǎng)易CodeWave低代碼平臺(tái)技術(shù)負(fù)責(zé)人稱(chēng)之為AI友好。他舉例目前CodeWave智能開(kāi)發(fā)平臺(tái)之所以快速能接入Agent能力,在自然語(yǔ)言邏輯編寫(xiě)效果不錯(cuò),也是因?yàn)樗鼈冊(cè)诖a語(yǔ)言上做了一些準(zhǔn)備和限定。
代碼生成技術(shù)此前遇到的很大問(wèn)題在于,只能生成固定領(lǐng)域或者固定技術(shù)棧的代碼,但其實(shí)Web開(kāi)發(fā)實(shí)踐中,前端后端技術(shù)棧非常多。
此前CodeWave智能開(kāi)發(fā)平臺(tái)構(gòu)建了一種NASL語(yǔ)言,這種語(yǔ)言比較收斂,抹平了前后端的一些類(lèi)型的差異,能夠真正實(shí)現(xiàn)全??梢暬帉?xiě)。去年大模型到來(lái)后,他們發(fā)現(xiàn)收斂的編程語(yǔ)言更利于AI的學(xué)習(xí)和訓(xùn)練以及生成。“這是意外之喜。統(tǒng)一編程語(yǔ)言的設(shè)計(jì),對(duì)AI是非常友好的”。
大模型能力本身也對(duì)Agent的能力和形態(tài)產(chǎn)生影響。智譜CEO張鵬此前受訪時(shí)就說(shuō),Agent的本源仍然是大模型的基礎(chǔ)能力,大腦的智力水平足夠高,才能談理解、推理、規(guī)劃和執(zhí)行這些事。
一位Agent應(yīng)用開(kāi)發(fā)者告訴數(shù)智前線,一些基于GPT-4上能使用的能力,遷移到一些國(guó)內(nèi)大模型上就不可用了,“這非常常見(jiàn),其實(shí)也對(duì)Agent的實(shí)際落地造成了非常大的困擾。”這需要國(guó)內(nèi)基礎(chǔ)大模型廠商的共同努力。
而除了Agent的各種能力本身,實(shí)在智能Agent智能體項(xiàng)目核心算法負(fù)責(zé)人認(rèn)為,安全機(jī)制的構(gòu)建也必不可缺,“不僅需要官方定義的那幾個(gè)能力,還需要安全性和多Agent之間的協(xié)同,才能在B端更好落地。目前這也是我們花了很大精力做的工作?!?/p>
2024年被周健視作Agent的元年。他認(rèn)為,經(jīng)過(guò)一年發(fā)展,大模型公司也在思考商業(yè)化問(wèn)題,而大模型要落地,需要AI Agent公司來(lái)完成,因此,2024應(yīng)用為王,行業(yè)要用各種各樣的新應(yīng)用,證明生產(chǎn)力確實(shí)是能夠被大模型封裝,走向智能?!澳撤N程度上,整個(gè)行業(yè)需要一個(gè)爆款”。