文|新火種 一號(hào)
從ChatGPT到AI Agent的演進(jìn)
當(dāng)我們提到人工智能(AI)的時(shí)候,大多數(shù)人首先想到的可能就是像ChatGPT這樣的聊天機(jī)器人,這些聊天機(jī)器人通過理解還有生成自然語言,可以給我們提供信息還有娛樂。但這會(huì)是AI最終的形式嗎?
前幾天,比爾蓋茨在他的個(gè)人博客上寫到:AI Agent將是人工智能的未來。而前兩天,國內(nèi)一家叫面壁智能的公司也推出了他們的AI Agent產(chǎn)品ChatDev,可以在短時(shí)間內(nèi)完成一個(gè)軟件或者一個(gè)小游戲的開發(fā),而你所需要做的,就是提供給它一個(gè)要求。
這似乎讓我們開始意識(shí)到,AI Agent可能會(huì)帶來更加深遠(yuǎn)的變革。正如比爾蓋茨在博客中提到的,AI Agent將改變我們和技術(shù)的互動(dòng)方式,引領(lǐng)全新的計(jì)算機(jī)時(shí)代。它所代表的,將不僅僅是一個(gè)智能程序,而是一種更先進(jìn)、更能理解和適應(yīng)人類需求的技術(shù)實(shí)體。
AI Agent的定義和工作原理
盡管從比爾蓋茨到OpenAI,大家都在談AI Agent,但是它還沒有一個(gè)確切的定義。目前,在行業(yè)內(nèi)關(guān)于AI Agent達(dá)成的共識(shí),主要來自O(shè)penAI的一篇博文。它將AI Agent定義為:大語言模型作為大腦,Agent具備感知、記憶、規(guī)劃和使用工具的能力,能夠自動(dòng)化實(shí)現(xiàn)用戶復(fù)雜的目標(biāo),這其實(shí)也奠定了AI Agent的基本框架。
AI Agent能夠在沒有明確指令的情況下作出反應(yīng),根據(jù)環(huán)境變化靈活調(diào)整行為。
例如,面壁智能的ChatDev平臺(tái)展示了AI Agent如何在軟件開發(fā)中自動(dòng)化地完成從項(xiàng)目管理到編程的各項(xiàng)任務(wù),大大簡(jiǎn)化了傳統(tǒng)流程。這種AI Agent的工作原理基于復(fù)雜的算法和大量的數(shù)據(jù)輸入,使其能夠理解復(fù)雜的環(huán)境和需求,并作出相應(yīng)的反應(yīng)。
AI Agent與傳統(tǒng)AI技術(shù)的比較
與傳統(tǒng)AI系統(tǒng)相比,AI Agent更加“智能”和“人性化”。它們不僅能理解復(fù)雜的自然語言指令,還能根據(jù)環(huán)境的變化做出自主決策。
例如,在GPT-4剛推出不久,就有一個(gè)開源項(xiàng)目Auto GPT非常出名,僅10天就獲得8萬多個(gè)星標(biāo)。你只需要告訴它一個(gè)目標(biāo),比如“寫一篇AI的論文”,它就能自動(dòng)地完成目標(biāo),當(dāng)然不是一步到位,而是它會(huì)主動(dòng)向AI提問,再根據(jù)AI回答的內(nèi)容再次提問,知道完成你告訴它的目標(biāo)。
而普通的AI只能根據(jù)你每一次的提問來回答你,在這種過程中,人們依舊需要花費(fèi)很多時(shí)間在提問和修正上。
AI Agent發(fā)展的兩個(gè)階段
1.單體智能
相信不少人都看過漫威電影中鋼鐵俠的助手——賈維斯。隨著OpenAI開發(fā)者大會(huì)的舉行,ChatGPT正在展露其成為“賈維斯”的潛力。ChatGPT作為一個(gè)先進(jìn)的語言處理工具,其未來發(fā)展方向可能更加傾向于成為一個(gè)全面的AI Agent。
這意味著它不僅僅會(huì)是一個(gè)基于文本的聊天機(jī)器人,而是能夠更加深入地理解和響應(yīng)用戶需求,執(zhí)行更復(fù)雜的任務(wù),甚至可能在未來與物理世界互動(dòng),如通過控制機(jī)器人或與其他智能系統(tǒng)交互。這種轉(zhuǎn)變將使ChatGPT不僅限于文本處理,而是成為一個(gè)更加全面的智能代理,能夠在多個(gè)領(lǐng)域發(fā)揮重要作用。
2.群體智能
與單體智能相比,群體智能更依賴于AI之間的相互協(xié)作。面壁智能打造的ChatDev以及“斯坦福小鎮(zhèn)”均是屬于多智能體協(xié)作的群體智能。它主要是想一個(gè)公司組織,每個(gè)AI會(huì)有固定的角色和分工。
例如在軟件開發(fā)的過程中,就可能涉及產(chǎn)品經(jīng)理、技術(shù)研發(fā)人員、測(cè)試人員等,每個(gè)AI都要在其中發(fā)揮自己的作用,當(dāng)然與人類社會(huì)一樣,它們的合作之中也會(huì)出現(xiàn)互相Battle的情況。而群體智能相較于單體智能,其優(yōu)點(diǎn)在于可以通過兩個(gè)AI角色之間的互相溝通,來減少執(zhí)行幻覺的出現(xiàn);各角色之間的反饋機(jī)制,類似現(xiàn)實(shí)中的工作匯報(bào),也可以用來增強(qiáng)運(yùn)行的準(zhǔn)確性。
AI Agent的未來應(yīng)用
客戶服務(wù): 在客戶服務(wù)領(lǐng)域,大模型驅(qū)動(dòng)的自主代理(LLMops AI Agent)能有效處理客戶咨詢并提供個(gè)性化支持,極大提升了用戶滿意度。這一應(yīng)用可以在銀行、電商平臺(tái)等多個(gè)行業(yè)中得到廣泛的應(yīng)用,可以有效提高客戶互動(dòng)的質(zhì)量和效率。
數(shù)據(jù)可視化: ChartGPT AI Agent在數(shù)據(jù)可視化領(lǐng)域中,可以將原始數(shù)據(jù)轉(zhuǎn)化為交互式圖表和圖形,使數(shù)據(jù)分析變得更加高效和直觀。這在市場(chǎng)分析、健康數(shù)據(jù)追蹤等領(lǐng)域尤為重要,它提供了一種新的方式來呈現(xiàn)和理解大量復(fù)雜的信息。
軟件開發(fā): 以我們上面提到的面壁智能的ChatDev平臺(tái)為例,它展示了AI Agent如何在軟件開發(fā)中提高效率。用戶僅需要用簡(jiǎn)單的語言描述需求,AI Agent便能自動(dòng)開始工作,通過一間“AI小公司”完成開發(fā)任務(wù)。這在減少開發(fā)時(shí)間和提升軟件質(zhì)量方面都具有重要意義。
從長遠(yuǎn)來看,AI Agent將會(huì)形成更深層次的智能連接,從虛擬數(shù)據(jù)走向物理現(xiàn)實(shí)。從而誕生物的智能以及機(jī)器人之間的聯(lián)動(dòng),從而形成“智聯(lián)網(wǎng)”,在個(gè)人層面,每個(gè)人的Agent講能夠通過虛擬數(shù)據(jù)連接在一起,形成一個(gè)更大的虛擬組織;在企業(yè)層面,不同的企業(yè)和員工甚至是物品都能夠通過Agent納入到一個(gè)巨大的虛實(shí)結(jié)合網(wǎng)絡(luò)中,從而提供更強(qiáng)的生產(chǎn)力,重塑整個(gè)生產(chǎn)關(guān)系,也將使得整個(gè)社會(huì)的產(chǎn)能得到提升。