一本大道一卡2卡三卡4卡国产,99精品视频免费在线观看,色婷婷极品视频

文｜王吉偉

百度發(fā)布文心一言正式發(fā)布不久后的4月，很多人還在感嘆文心一言生成的圖片多歡樂，更多人在為ChatGPT、Midjourney各種培訓而瘋狂的時候，Meta創(chuàng)始人兼CEO扎克伯格正在想著如何“以有用且有意義的方式”向全球數(shù)十億人介紹AI Agents的機會。

OpenAI完成新一輪3億美元融資的5月，創(chuàng)始人Sam Altman私下對一些開發(fā)者說希望將ChatGPT打造成個人工作助手，知情人士透露的消息則是OpenAI一直在關注如何使用聊天機器人來創(chuàng)建自主AI Agents，相關功能很有可能部署在ChatGPT助手中。

6月的一次全體員工會議上，扎克伯格宣布了一系列處于不同開發(fā)階段的技術，其中一個就是將帶來具有不同個性和能力的AI Agents為用戶提供幫助或娛樂。

在國內(nèi)，雖然AutoGPT早在4月份就與國外同步火了，但限于大部分人對其背后的AI Agent缺少了解，開始的反響并不是太熱烈。

直到7月初OpenAI應用人工智能研究負責人Lilian Weng那篇關于AI Agent的博文刷爆AI圈后，媒體圈、學研界、投資領域才真正開始熱烈討論AI Agent。

由此國內(nèi)真正開啟了探索與研究AI Agent的熱潮，并且也有一些廠商開始以AI Agent模式重構產(chǎn)品架構與商業(yè)模式。

隨著AI Agent原理、模式以及構建方式越發(fā)明朗，很多受困于技術、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

AI Agent不僅讓大家看到了大語言模型（LLM，Large language Model）落地的方向，讓更多創(chuàng)業(yè)者進一步燃起了LLM創(chuàng)業(yè)的希望，也讓廣大企業(yè)看到了高效應用LLM的未來趨勢。

對于AI Agent創(chuàng)業(yè)，OpenAI的聯(lián)合創(chuàng)始人Andrej Karpathy認為，普通人、創(chuàng)業(yè)者和極客在構建Agents方面比OpenAI更有優(yōu)勢，大家處于平等競爭的狀態(tài)。

而大公司一邊，面對大型科技公司和創(chuàng)業(yè)公司都有可能抓住這次Agent的機會，比爾蓋茨也表示如果微軟沒有介入他會感到失望。

在科技巨頭強勁推動、創(chuàng)業(yè)者快速擁抱以及大企業(yè)的積極引入下，AI Agent徹底火爆了。并且與之前LLM缺乏落地的境況不同，這次AI Agent再也不是紙上談兵，目前已經(jīng)有很多公司推出了Agent項目及相關產(chǎn)品。

有業(yè)內(nèi)人士透露，至少有100+項目正致力于將AI智能體商業(yè)化，近10萬名開發(fā)人員正在構建自主Agent。在這些AI Agents中，既有國外主要基于GPT與開源Agent框架構建的Agent項目，也有國內(nèi)基于國產(chǎn)大模型（自研領域大模型）+開源架構的Agent產(chǎn)品。

說了那么多，都有哪些公司推出了Agent產(chǎn)品？目前的AI Agent產(chǎn)品又是什么形態(tài)？本文王吉頻道盤點了全球六十個AI Agent，以讓大家更好地了解AI智能體。

從AI Agent說起

雖然LLM具備了足夠的智慧，但想要讓它給出精確答案，還需要輸入足夠精準的prompt。一個掌握prompt的人和一個普通人使用同一個大模型提問問題，得到的答案會有很大區(qū)別：前者可以用多種技巧得到想要的結果，而后者就只能望LLM興嘆了。

想要用好LLM，就得先學會使用prompt，這個需求已經(jīng)催生出一個不小的培訓市場。prompt提示工程，在增加LLM使用難度的同時，也使得用戶體驗有所降低。本來應該盡顯自然語言優(yōu)勢的LLM，反而因為繁雜的prompt而變得對普通用戶不是那么友好。

這樣，提示工程也就成了橫亙在普通人與大模型之間的一座大山。

如何更好地解決這個問題呢？答案正是AI Agent（國內(nèi)稱作AI智能體）。

AI Agent是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能實體。不同于傳統(tǒng)的AI，AI Agent 具備通過獨立思考、調(diào)用工具去逐步完成給定目標的能力。

而在LLM到來之后，AI Agent就被定義為基于LLM驅(qū)動的Agent實現(xiàn)對通用問題的自動化處理。

我們知道，LLM主要擅長處理和生成文本。它們可以回答問題、寫文章、生成創(chuàng)意內(nèi)容、幫助編程等。但LLM還是一個被動的工具，只在你給它輸入時才會產(chǎn)生輸出。

AI Agent提供了更廣泛的功能，特別是在與環(huán)境的交互、主動決策和執(zhí)行各種任務方面?？梢哉f，AI Agent是真正釋放LLM潛能的關鍵，它能為LLM核心提供強大的行動能力。

AI Agent和大模型的主要區(qū)別在于：大模型與人類之間的交互是基于prompt實現(xiàn)的。用戶prompt是否清晰明確會影響大模型回答的效果，沒有精確有效的prompt，即便是能力最強的ChatGPT也不行。

AI Agent 的工作僅需給定一個目標，就能夠針對目標獨立思考并做出行動，它會根據(jù)給定任務詳細拆解出每一步的計劃步驟，依靠來自外界的反饋和自主思考，為自己創(chuàng)建 prompt以實現(xiàn)目標。

比如讓ChatGPT買一杯咖啡，ChatGPT給出的反饋一般類似“無法購買咖啡，它只是一個文字AI助手”之類的回答。

但你要告知基于ChatGPT的AI Agent工具讓它買一杯咖啡，它會首先拆解如何才能為你購買一杯咖啡并擬定代用某APP下單以及支付等若干步驟，然后按照這些步驟調(diào)用APP選擇外賣，再調(diào)用支付程序下單支付，過程無需人類去指定每一步操作。

雖然AI工具和Agent都是旨在自動化任務的軟件程序，但特定的關鍵特征將AI智能體區(qū)分為更復雜的AI 軟件。

當AI工具具有以下特征時，就可以將該工具視為AI Agent:

自治（Autonomy）：AI 虛擬智能體能夠獨立執(zhí)行任務，而無需人工干預或輸入。
知覺（Perception）：智能體功能通過各種傳感器（如攝像頭或麥克風）感知和解釋它們所處的環(huán)境。
反應（Reactivity）：AI 智能體可以評估環(huán)境并做出相應的響應以實現(xiàn)其目標。
推理和決策（Reasoning and decision-making）：AI 智能體是智能工具，可以分析數(shù)據(jù)并做出決策以實現(xiàn)目標。他們使用推理技術和算法來處理信息并采取適當?shù)男袆印?/li>
學習（Learning）：他們可以通過機器、深度和強化學習元素和技術來學習和提高他們的表現(xiàn)。
通信（Communication）：AI 智能體可以使用不同的方法與其他智能體或人類進行通信，例如理解和響應自然語言、識別語音以及通過文本交換消息。
以目標為導向（Goal-oriented）：它們旨在實現(xiàn)特定目標，這些目標可以通過與環(huán)境的交互來預定義或?qū)W習。

在類別上，AI智能體分目前可分為自主智能體（Autonomous Agent）和生成智能體（Generative Agent）。

自主智能體如Auto-GPT，能夠根據(jù)人們通過自然語言提出的需求，自動執(zhí)行任務并實現(xiàn)預期結果。在這種合作模式下，自主智能體主要是為人類服務，更像是一個高效的工具。

生成智能體，如斯坦福和谷歌的研究者共同創(chuàng)建的西部世界小鎮(zhèn)或者《西部世界》中的人形機器人，它們在同一環(huán)境中生活，擁有自己的記憶和目標，不僅與人類交往，還會與其他機器人互動。

關于AI智能體，最近復旦大學自然語言處理團隊（FudanNLP）推出的86頁LLM-based Agents 綜述論文，全面梳理了基于大型語言模型的智能代理現(xiàn)狀，包括：LLM-based Agent 的背景、構成、應用場景、以及備受關注的代理社會。

說了這么多，很多朋友可能仍對AI智能體沒有直觀的感受。不要著急，下文我們將通過一個對比案例來加深大家的認知。

Ai 智能體滲透各領域

AiAgent.app是一個Web 應用，它允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務并實現(xiàn)目標。

下面王吉偉頻道將通過使用Ai智能體與直接使用LLM的對比體驗，看看AI智能體的優(yōu)勢。

比如想了解過去一個月AI行業(yè)的新聞和趨勢，在Claude輸入：過去一個月人工智能行業(yè)最新新聞和趨勢的摘要。

可以看到，Claude只是列出了幾條與AI相關的新聞資訊摘要。

而在AiAgent.app輸入這段話，它首先會將你的需求分解成十項任務，然后通過提示與用戶交互完成每一項任務，并為每項任務輸出結果。顯然，在AiAgent.app得到的關于近期AI行業(yè)的內(nèi)容，要比在直接使用其他LLM獲得的內(nèi)容更加全面。

直接使用大模型能夠獲取這些內(nèi)容嗎？理論上通過輸入更多的Prompt也能完成，但至少需要輸入十次，也不能保證所輸入Prompt精確性，且有時甚至不知道想要獲取什么信息。

而在AiAgent.app只需要輸入一句話，它就分析出了你可能的需求并列出相對全面的內(nèi)容目標，引導你去完成想要的東西，效率提升數(shù)倍。

兩者對比下來，在內(nèi)容獲取的豐富度以及效率上，顯然AI Agent更勝一籌。這種資訊內(nèi)容類Agent對媒體從業(yè)者、行業(yè)分析師等職業(yè)具有非常大的價值，能夠大大減少研究資料的獲取時間。

現(xiàn)在已經(jīng)出現(xiàn)了一些面向更精確用戶群體及應用場景的此類Agent，比如哥倫比亞大學推出的GPT Researcher就是一個基于ChatGPT的面向研究人員的Agent，可以為用戶創(chuàng)建各種研究報告以促進研究。

這個案例還只是內(nèi)容的獲取，事實上現(xiàn)在已經(jīng)出現(xiàn)面向多個應用場景的Agent，足以調(diào)動更多軟件應用乃至硬件設備完成各項任務。

比如有些人已經(jīng)通過AutoGPT實現(xiàn)了訂餐、訂票、打車以及購物；斯坦福西部世界小鎮(zhèn)里的25個AI Agent每天都在散步、約會、聊天、喝咖啡以及分享當天的新聞；谷歌Deepmind推出了利用機械臂自動執(zhí)行各種工作的robotic agent；亞馬遜也推出了Amazon Bedrock Agents用于自動分解企業(yè)AI應用開發(fā)任務；IBM Watson Health已經(jīng)在很多醫(yī)院幫助醫(yī)生診斷、治療和監(jiān)測患者。

雖然Ai Agent火爆的時間還不算長，但一經(jīng)出現(xiàn)就得到了眾多領域諸多企業(yè)的擁戴。大語言模型的多模特能力加上如今更大的算力，讓多年前就提出的Agent快速得到價值凸顯，并以超強的滲透率在更多領域落地。

而隨著MetaGPT等開源AI Agent的出現(xiàn)，更多技術供應商與創(chuàng)業(yè)團隊引入Agent，更多組織認知并接受Agent，它必然會快速成為LLM的落地個領域的主要模式，助力千行百業(yè)更好的應用LLM。

全球60個AI Agent大盤點

上面案例中所提到的AiAgent.app，是近幾個月來風頭正盛的AI Agent代表性產(chǎn)品之一。包括這款AI智能體在內(nèi)的國內(nèi)外多個Agent，均可以在下面的項目盤點名單中看到。

為了讓大家更好地了解目前已推出的AI Agent，王吉偉頻道將這些AI Agent分為媒體報道、國內(nèi)已推出、行業(yè)型、海外其他以及GitHub項目幾類，以后還會逐步獎勵項目庫，將這些Agent分門別類編入不同類別。

本文所盤點的AI Agents，既包括AI Agents框架及工具，也包括基于一些開源框架打造的AGENT產(chǎn)品，同時大部分項目及產(chǎn)品都為自主智能體。

因為一些廠商比較低調(diào)并未對外宣傳，本文盤點的AI Agent并不完全，所以也叫作AI AGENT不完全名單。歡迎更多廠商及創(chuàng)業(yè)者看到本文后與王吉偉頻道聯(lián)系，大家一起為AI AGENT生態(tài)的繁榮發(fā)展做一份貢獻。

一、媒體報道的AI Agent

1、Auto-GPT

Auto GPT是Github上的一個免費開源項目，結合了GPT-4和GPT-3.5技術，通過API創(chuàng)建完整的項目。

與ChatGPT不同的是，用戶不需要不斷對AI提問以獲得對應回答，在AutoGPT中只需為其提供一個AI名稱、描述和五個目標，然后AutoGPT就可以自己完成項目。它可以讀寫文件、瀏覽網(wǎng)頁、審查自己提示的結果，以及將其與所說的提示歷史記錄相結合。

Auto-GPT是GPT-4完全自主運行的首批示例之一，它突破了人工智能所能做的界限。

2、AgentGPT

AgentGPT允許您配置和部署自主AI智能體。只要為你的自定義AI命名并讓它開始任何可以想象的目標，它就能通過思考要完成的任務、執(zhí)行任務并從結果中學習來嘗試實現(xiàn)目標。

3、Baby AGI

這是一個人工智能驅(qū)動的任務管理系統(tǒng)。該系統(tǒng)使用OpenAI和Pinecone API來創(chuàng)建、確定優(yōu)先級和執(zhí)行任務。通過分析先前任務的結果和預定義的目標來創(chuàng)建任務，并使用 OpenAI 的自然語言處理（NLP）和Chroma在上下文中存儲和檢索任務結果。

Baby AGI的吸引力在于它能夠根據(jù)先前任務的結果自主解決任務并保持預定義的目標，還能有效地確定任務的優(yōu)先級。

4、Jarvis （HuggingGPT）

由Microsoft開發(fā)的一種獨特協(xié)作系統(tǒng)，可以使用多個AI模型來完成給定的任務，以ChatGPT充當任務控制者。該項目在GitHub上被稱為JARVIS，現(xiàn)在可以在Huggingface（因此稱為HuggingGPT）上試用，這個Agent與文本、圖像、音頻甚至視頻配合得非常好。

其工作方式類似于OpenAI通過文本和圖像展示GPT 4的多模態(tài)功能，但JARVIS 更進一步集成了用于圖像、視頻、音頻等的各種開源 LLM，還可以連接到互聯(lián)網(wǎng)并訪問文件。例如，您可以輸入來自網(wǎng)站的 URL 并詢問相關問題。

5、Aiagent.app

Ai Agent是一個Web 應用，允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務并實現(xiàn)目標。AI 智能體的工作原理是將目標分解為較小的任務，并逐個完成它們。好處包括能夠同時運行多個AI 智能體，并使對尖端技術的訪問民主化。

AI Agent還擁有諸如具有語法突出顯示的內(nèi)聯(lián)代碼塊，以及與第三方平臺的無縫協(xié)作等功能。該工具是免費使用的，它提供了一種簡化方法來構建AI智能體，無需更多技術知識。

6、Camel AGI

Camel AGI是一個生成式AI工具，使用戶能夠通過角色扮演自主AI智能體來解決給定的任務，當然用戶需要啟用Javascript以使用此工具。Camel AGI允許用戶使用AI智能體完成任務，并提供使用Google登錄或在Github上為該工具加星標的選項。

7、“Westworld” simulation西部世界小鎮(zhèn)

這個項目來自斯坦福大學和谷歌的研究人員創(chuàng)建了一個交互式沙盒環(huán)境，其中包含25個可以模擬人類行為的生成AI智能體。他們在公園里散步，在咖啡館喝咖啡，并與同事分享新聞，表現(xiàn)出令人驚訝的良好社交行為。

比如，從一個用戶指定的一個概念開始，即一個智能體想要舉辦情人節(jié)派對，智能體在接下來的兩天內(nèi)自動傳播派對邀請，結識新朋友，互相約對方約會派對，并協(xié)調(diào)在正確的時間一起出現(xiàn)在派對上。

8、GPT-Engineer

GPT-Engineer是一個開源AI工具，允許用戶指定他們想要構建的內(nèi)容，然后與AI進行澄清對話以生成所需的代碼庫。該工具旨在提供簡單靈活的用戶體驗，允許用戶根據(jù)自己的需要調(diào)整和擴展其功能。

該工具包括指定AI智能體的身份、存儲與GPT4的通信歷史記錄以及重新運行消息日志等功能。歡迎對項目做出貢獻，感興趣的個人可以參考 GitHub 存儲庫上提供的路線圖、項目和問題。GPT-Engineer旨在成為一個開放平臺，供開發(fā)人員探索和構建其代碼生成工具箱。

9、MetaGPT

MetaGPT是一個開源多智能體框架，采用單行輸入來生成 API、用戶故事、數(shù)據(jù)結構、競爭分析等。該框架可以充當產(chǎn)品經(jīng)理、軟件工程師和架構師。該框架可以充當整個軟件公司，只需一行代碼即可編排SOP。

MetaGPT與人類SOP流程設計集成。因此，基于LLM的智能體生成高質(zhì)量，多樣化，結構化的文檔和設計。MetaGPT 的設計使為復雜任務設計解決方案變得容易，并提供幾乎可以與人類智能相媲美的問題解決能力。

10、Amazon Bedrock Agents

亞馬遜發(fā)布的Amazon Bedrock Agents，允許開發(fā)人員快速創(chuàng)建完全托管的智能體。通過對企業(yè)系統(tǒng)執(zhí)行API調(diào)用，Amazon Bedrock智能體加快了可管理和執(zhí)行活動的生成式AI應用程序的發(fā)布速度。

Amazon Bedrock Agents簡化了用戶請求任務的快速工程和編排。設置完成后，這些智能體可以自主構建提示，并使用公司特定的數(shù)據(jù)安全地增強提示，從而向用戶提供自然語言響應。這些高級智能體具有推斷自動處理用戶請求的必要操作的能力。

11、nvidia Voyager

由NVIDIA、加州理工學院等共同推出的Voyager，使用GPT-4來引導學習的Minecraft智能體通過像素世界，需要說明的是，Voyager依賴于代碼生成，而不是強化學習。

Voyager是第一個玩《我的世界》的終身學習智能體。與其他使用經(jīng)典強化學習技術的 Minecraft智能體不同，Voyager使用GPT-4來不斷改進自己，通過編寫、改進和傳輸存儲在外部技能庫中的代碼來實現(xiàn)這一點。

這會產(chǎn)生一些小程序，幫助導航、開門、挖掘資源、制作鎬頭或與僵尸作戰(zhàn)。GPT-4解鎖了一種新的范式，在此范式中“訓練”是代碼的執(zhí)行，“訓練模型”是Voyager迭代組裝的技能代碼庫。

12、RoboAgent

Meta和CMU 聯(lián)合研究團隊耗時兩年，成功開發(fā)出的RoboAgent 通用機器人智能體。RoboAgent僅僅通過7500個軌跡的訓練就實現(xiàn)了12種不同的復雜技能，包括烘焙、拾取物品、上茶、清潔廚房等任務，并能在100種未知場景中泛化應用。

無論遇到多大的干擾，RoboAgent 都能堅持完成任務。該研究的目標是建立一個高效的機器人學習范例，解決數(shù)據(jù)集和場景多樣性的挑戰(zhàn)。研究人員提出了多任務動作分塊 Transformer（MT-ACT）架構，通過語義增強和高效的策略表示來處理多模態(tài)多任務機器人數(shù)據(jù)集。

13、Inflection AI Pi

Inflection AI公司推出的個人AI Agent產(chǎn)品Pi，核心大腦是公司研發(fā)的Inflection-1大模型，性能媲美GPT-3.5。Pi與時下流行的通用聊天機器人不同，它只能進行友好的對話，提供簡潔的建議，甚至只是傾聽。

它的主要特征是富有同情心、謙虛好奇、幽默創(chuàng)新，具有良好的情商，可以根據(jù)用戶的獨特興趣和需求提供無限的知識與陪伴。Inflection自開發(fā)Pi開始，就確定了Pi將作為個人智能（Personal Intelligence），而不僅僅是輔助人工作的工具。

14、HyperWrite

Hyperwrite是一款AI寫作智能體工具，可幫助任何級別的創(chuàng)意作家更快、更自信地寫作。它包括自動寫入和提前打字等功能，可生成原始段落并提出克服作家障礙的想法。

該工具作為免費的Chrome擴展程序提供，可以在任何網(wǎng)站上使用，而不會中斷工作流程。它被世界各地的專業(yè)人士、學生和創(chuàng)作者使用和信任，以提高他們的生產(chǎn)力。

15、GPT Researcher

GPT Researcher是一個基于AI的自主智能體，用于對各種任務進行全面的在線研究。該工具受到AutoGPT和“計劃和解決”提示的啟發(fā)，旨在改進當前語言模型中發(fā)現(xiàn)的速度和確定性問題，“通過并行智能體工作提供更穩(wěn)定的性能和更高的速度，而不是同步操作。

根據(jù)該團隊的說法，GPT研究員通過生成相關的研究問題、匯總來自 20 多個網(wǎng)絡資源的數(shù)據(jù)以及利用GPT3.5-turbo-16和GPT-4來創(chuàng)建全面的研究報告來促進研究。

國內(nèi)已推出的AI Agent

經(jīng)過持續(xù)探索與嘗試，國內(nèi)AI智能體相關的產(chǎn)品也開始嶄露頭角，下面介紹五款產(chǎn)品。

1、阿里云ModelScopeGPT

阿里云Mota社區(qū)推出的國內(nèi)首個大型模型調(diào)用工具魔搭GPT（ModelScopeGPT），通過這一款工具，使用者們可以通過一鍵發(fā)送指令調(diào)用Mota社區(qū)中的其他人工智能模型，從而實現(xiàn)大大小小的模型共同協(xié)作，進而完成復雜的任務。

ModelScopeGPT基于開源大語言模型（LLM）的AI Agent（智能體）開發(fā)框架ModelScope-Agent。這是一個通用的、可定制的Agent框架，用于實際應用程序，其基于開源的大語言模型 (LLMs) 作為核心，包含記憶控制、工具使用等模塊。

開源 LLM 主要負責任務規(guī)劃、調(diào)度以及回復生成；記憶控制模塊，主要包含知識檢索以及 prompt （提示詞）管理；工具使用模塊，包含工具庫以及工具檢索和工具可定制化。

2、實在智能TARS-RPA-Agent

實在智能在超自動化領域首發(fā)的TARS-RPA-Agent，是一個基于“TARS+ISSUT（智能屏幕語義理解）”雙模引擎、有“大腦”，更有“眼睛和手腳”的超自動化智能體，是能夠自主拆解任務、感知當前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗的RPA全新模式產(chǎn)品。

TARS-RPA-Agent采用以TARS大模型和ISSUT智能屏幕語義理解為基座的技術框架。該技術框架分為兩層結構：底層是包括通用基礎模型和各個垂直行業(yè)基礎模型在內(nèi)的TARS系列大模型和智能屏幕語義理解技術；上層是依托這兩項關鍵技術完成全面升級和改造的超自動化產(chǎn)品。

TARS-RPA-Agent的核心LLM是實在智能基于通用大模型基座的自研垂直“塔斯（TARS）”大模型，TARS大模型具備優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力。

3、OmBot歐姆智能體

2023 世界人工智能大會上，聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體（Auto AI Agent ）——OmBot 歐姆智能體，并針對典型場景需求推出了首批應用。

聯(lián)匯自主智能體包含了認知、記憶、思考、行動四大核心能力，作為一種自動、自主的智能體，它以最簡單的形式中在循環(huán)中運行，每次迭代時，它們都會生成自我導向的指令和操作。因此，它不依賴人類來指導命令，具備高度可擴展性。

4、瀾碼科技Ask XBot

瀾碼科技構建的Agent平臺“Ask XBot”，平臺分兩層：第一層是專家賦能，專家通過拖、拉、拽以及對話交互的方式定義工作流程，教給機器，從而協(xié)助一線員工構建更高效工作的方法論；第二層是員工使用Agent，一線員工可以通過自然語言和Agent溝通并下達指令，讓Agent協(xié)助完成數(shù)據(jù)分析、資料調(diào)取等工作。

該公司計劃將Ask XBo打造成一個兼具通用性和易用性的平臺，把這些API和Agent做好管理，讓Agent包裝不同的API，不同模型的Agent能夠在上面更好地協(xié)作，讓它們可以在平臺上更有效率、更智能地服務好客戶。

5、ChatDev

由清華大學、北京郵電大學、布朗大學聯(lián)合研究團隊推出的ChatDev，是一個生成式智能體。它基于聊天的端到端軟件開發(fā)框架，能夠利用大型語言模型（LLMs）促進軟件開發(fā)過程中多角色（ChatGPT 的 “gpt3.5-turbo-16k” 版本）之間的有效溝通和協(xié)作。

ChatDev的主要目的是通過聊天來進行游戲開發(fā)。用戶只需提出想法，從設計到測試的整個流程都由AI完成，整個過程只需七分鐘即可完成。

面向不同領域的AI Agent產(chǎn)品

LLM還沒有出現(xiàn)之前，一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結合應用。因此，AI Agenmt在各領域的落地比大家預想得要快很多。

下面，是幾個行業(yè)領域的代表性Agent應用。

在醫(yī)療領域，Agent可以幫助診斷、治療和監(jiān)測患者。IBM Watson Health 是一個AI智能體，可以分析醫(yī)療數(shù)據(jù)，以識別潛在的健康問題并推薦治療方案。
在金融領域，Agent可以分析財務數(shù)據(jù)、檢測欺詐行為并提出投資建議。嘉信理財（Charles Schwab）使用名為Intelligent Portfolio的人工智能智能體，根據(jù)客戶的投資目標創(chuàng)建和管理投資組合。
在零售業(yè)務場景中，Agent可以提供個性化推薦，改善供應鏈管理，增強客戶體驗。亞馬遜的Alexa是一個AI智能體，可以推薦產(chǎn)品，下訂單和跟蹤發(fā)貨。
在制造業(yè)，Agent可以優(yōu)化生產(chǎn)流程，預測維護需求，提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實時監(jiān)控機器，以預測和防止設備故障。
在運輸領域，自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動駕駛車輛，并幫助駕駛員停車、變道和安全駕駛。
在教育行業(yè)，Agnet可以提供個性化的學習體驗，自動執(zhí)行管理任務并分析學生的表現(xiàn)。培生（Pearson）的AI智能體Aida可以為學生提供反饋，并建議個性化的學習路徑。
在農(nóng)業(yè)領域，AI Agent可以優(yōu)化作物生產(chǎn)、監(jiān)測土壤質(zhì)量并預測天氣模式。約翰迪爾（John Deere）正在使用一種名為See&Spray的AI智能體來檢測和定位雜草，而不會影響作物。

海外已推出其他AGENT產(chǎn)品

1、Cognosys

Cognosys是基于Web的AI智能體，旨在徹底改變生產(chǎn)力并簡化復雜任務，使用最先進的 AI 技術提升您的日常生活。

2、Doanythingmachine

使用“無所不能”機器輕松管理您的任務，用戶個人AI 智能體將為您確定優(yōu)先級并完成您的任務

3、alphakit

用于創(chuàng)建和管理目標驅(qū)動型自主AI智能體團隊的直觀平臺，全部通過手機創(chuàng)建和管理 autoGPT AI智能體團隊。只需定義你的目標，Alphakit負責剩下的工作。

4、GPTConsole

GPTConsole是一個革命性的命令行界面（CLI），旨在為開發(fā)人員提供人工智能的優(yōu)勢。它超越了傳統(tǒng)的終端功能，使用戶能夠使用提示執(zhí)行復雜的任務。

5、Fini

提供指向知識庫的鏈接，在2分鐘內(nèi)將您的知識庫轉(zhuǎn)換為AI聊天。Fini為用戶提供一個不知疲倦的AI智能體，隨時準備24/7立即回答客戶問題。

6、Spell

Spell是一款基于GPT4自主AI智能體，可以應用于日常高效工作。Spell還具有急需的功能，可幫助您更智能地工作，并學習利用生成式AI 的強大功能，生成一個或多個創(chuàng)新的自主智能體，這些智能體將致力于解決您的問題。

7、Aomni

Aomni是一個信息檢索AI智能體，能夠為你查找、提取和處理互聯(lián)網(wǎng)上的任何數(shù)據(jù)，增強你的研究工作。Aomni可以使用各種工具來智能地規(guī)劃你的查詢以獲得最終結果，包括一個完整的 Web 瀏覽器，允許它訪問互聯(lián)網(wǎng)上的任何信息，而無需 API。

Aomni的查詢規(guī)劃器基于當前最先進的AutoGPT架構，智能地計劃和更新每個請求，以確保來源的正確性和多樣性。

8、Fine-Tuner.ai

借助Fine-Tuner.ai，用戶可以構建復雜、量身定制的AI智能體，而無需技術技能或編碼，只需輸入你的數(shù)據(jù)和想法即可。十幾個專業(yè)AI智能體通過上傳的PDF、CV、PPT、URL 等即時數(shù)據(jù)，可為用戶創(chuàng)建精確的問答、文檔搜索、流程自動化等。

9、SuperAGI

一個開源的自主AI框架，使您能夠快速可靠地開發(fā)和部署有用的自主智能體，用于構建、管理和運行自主智能體的基礎結構。

10、Yellow.ai

Yellow.ai是領先的企業(yè)級對話式人工智能平臺，可以為企業(yè)動態(tài)AI智能體提供支持，旨在通過其無代碼/低代碼平臺提供類似人類的交互，從而提高客戶滿意度并提高員工敬業(yè)度。

11、Godmode

使用戶能夠在瀏覽器中運行AutoGPT。Godmode允許用戶同時部署多個AI智能體以使用AI 完成任務，用戶也可以使用自己的OpenAI API密鑰。

12、E42

E42是一個認知流程自動化平臺，企業(yè)可以使用該平臺創(chuàng)建多功能認知智能體，以跨功能自動化各種流程。認知驅(qū)動的無代碼平臺與用戶現(xiàn)有的技術和流程無縫集成，以釋放跨部門的最高價值。用戶可使用E42構建自己的AI智能體，比如AI分析師以及跨垂直行業(yè)的AI招聘人等。

13、Thankful

Thankful的AI智能體經(jīng)過培訓和量身定制，可在您現(xiàn)有的幫助臺中工作，通過電子郵件，聊天，短信和應用內(nèi)渠道輕松解決大量客戶查詢。憑借理解、連接、解決、個性化和通知的能力，ThankfulAI智能體以機器般的速度和天生可擴展的專業(yè)知識提供類似人類的服務體驗。

14、Aktify

使用Aktify的虛擬AI智能體克隆您的銷售團隊，無需增加員工人數(shù)。Aktify將大規(guī)模處理無限數(shù)量的無響應潛在客戶），并始終如一地將隨時可以交談的客戶帶到您的銷售團隊的門口，它不只一個短信聊天機器人。

15、TeamSmart AI

通過一鍵訪問TeamSmart AI來提高您的工作效率。在瀏覽器中直接匯總內(nèi)容、生成代碼、起草推文等。單擊圖標或鍵盤快捷鍵即可立即打開ChatGPT，無需登錄，即可即時訪問質(zhì)量提示庫。

16、BrainstormGPT

BrainstormGPT集成了多個智能體、LLM和自動搜索，以簡化主題到會議報告轉(zhuǎn)換。自定義主題，用戶定義的角色，智能體自主討論，在 20 分鐘內(nèi)輸出的報告，約等于300 次搜索、10 小時討論和 100,000 次文本分析。

17、AgentRunner.Ai

AgentRunner.ai是一個自主AI 智能體創(chuàng)建工具，它利用 GPT-4的強大功能來創(chuàng)建和訓練完全自主的智能體。允許用戶為他們的智能體設定目標，并讓他們決定如何實現(xiàn)這些目標，而無需任何技術知識或編程技能。

該工具提供的功能包括創(chuàng)建具有獨特個性的自主智能體，運行智能體以執(zhí)行任務或?qū)W習新技能，決定智能體可以做什么以及與OpenAI或Google Cloud帳戶集成。

18、Gista

Gista可幫助企業(yè)與網(wǎng)站訪問者互動并將其轉(zhuǎn)化為24/7的潛在客戶，其主要功能包括構建AI轉(zhuǎn)換智能體和AI銷售智能體。使用 Gista，企業(yè)可以輕松地將網(wǎng)站訪問者轉(zhuǎn)化為潛在客戶并建立電子郵件列表。

19、Agent4

Agent4的主要功能之一是能夠創(chuàng)建AI驅(qū)動的虛擬智能體，可以回答問題，幫助預訂會議，收聽語音郵件并提供摘要。

您可以輕松地為座席創(chuàng)建自定義交互，使他們能夠用您品牌的聲音回答問題并處理各種任務。您還可以選擇座席如何實時響應呼叫，并決定是否以及何時需要與某人交談。

20、Cometcore AI

Cometcore AI是一個創(chuàng)新平臺，提供一系列多功能的AI驅(qū)動的工具，以提高生產(chǎn)力和溝通能力。使用Cometcore，您可以制作、編碼和自動化可愛的智能體。

21、personal-assistant

一個人工智能代理，旨在處理從預訂航班到進行深入研究以及介于兩者之間的所有任務。

Github上的AI Agent項目

1、OpenAGI

OpenAGI是一個開源的AGI研究平臺，專門設計用于提供復雜的多步驟任務，并附有特定于任務的數(shù)據(jù)集，評估指標和各種可擴展模型。OpenAGI將復雜的任務表述為自然語言查詢，作為LLM的輸入。LLM隨后選擇，合成和執(zhí)行OpenAGI提供的模型來解決任務。

該項目還提出了任務反饋強化學習（RLTF）機制，該機制使用任務解決結果作為反饋來提高LLM的任務解決能力。LLM負責綜合各種外部模型來解決復雜任務，而RLTF提供反饋以提高其任務解決能力，為自我改進的AI提供反饋循環(huán)。LLM操作各種專家模型來解決復雜任務的范式是AGI的一種有前途的方法。

2、Agent-LLM

Agent-LLM是一個人工智能自動化平臺，旨在為跨多個提供商的高效AI指令管理提供動力。

該智能體配備了自適應內(nèi)存，這種多功能解決方案提供了一個強大的插件系統(tǒng)，支持各種命令，包括網(wǎng)頁瀏覽。隨著對眾多人工智能提供商和模型的支持不斷增加，Agent-LLM不斷發(fā)展以增強各種應用程序。

3、AutoGPT-Next-Web

該智能體可以實現(xiàn)一鍵式即在Vercel上部署精心設計的AutoGPT-Next-Web Web UI，一鍵免費部署你的私人AutoGPT-Next-Web 網(wǎng)頁應用。基于AutoGPT-Next-Web，用戶可在1 分鐘內(nèi)使用Vercel 免費一鍵部署，搭建個人的AutoGPT網(wǎng)站。

4、MiniGPT-4

這款Agent，可以使用高級大語言模型增強視覺語言理解。

5、Mini-AGI

Mini-AGI是基于GPT3.5/4的最小通用自主智能體。它結合了強大的提示，一組最少的工具和短期記憶（思想鏈），通過矢量存儲的數(shù)據(jù)增強將很快添加，可以分析股票價格、執(zhí)行網(wǎng)絡安全測試、創(chuàng)作藝術品和訂購披薩。

6、Teenage-AGI

此智能項目受幾個與Auto-GPT相關的項目（主要是BabyAGI）和論文“生成智能體：人類行為的交互式模擬”的啟發(fā)，這個Python項目使用OpenAI和Pinecone為AI智能體提供記憶，并允許它在采取行動（輸出文本）之前“思考”。

7、FastGPT

FastGPT 是一個基于 LLM 大語言模型的知識庫問答系統(tǒng)，提供開箱即用的數(shù)據(jù)處理、模型調(diào)用等能力。同時可以通過 Flow 可視化進行工作流編排，從而實現(xiàn)復雜的問答場景

8、DemoGPT

使用DemoGPT，只需使用簡單句子即可快速創(chuàng)建演示。

9、LocalAGI

基于LLMDA、ChatGLM 等模型的本地運行AGI項目。

10、ai-town（游戲類）

著名投資機構a16z開源的AI小鎮(zhèn)，一個MIT 許可的、可部署的入門工具包，用于構建和定制您自己的AI城鎮(zhèn)版本。這是一個 AI 角色生活、聊天和社交的虛擬城鎮(zhèn)。

11、gptrpg（游戲類）

gptrpg此存儲庫包含兩件事：一個簡單的類似RPG游戲的環(huán)境，用于支持 LLM 的 AI 智能體；連接到 OpenAI API 以存在于該環(huán)境中的簡單 AI 智能體。

12、SFighterAI（游戲類）

該項目是一個使用深度強化學習訓練的AI智能體，以擊敗游戲《街頭霸王II：特別冠軍版》中的最終BOSS。AI 智能體僅根據(jù)游戲屏幕的 RGB 像素值做出決策。在提供的保存狀態(tài)下，智能體在最終關卡的第一輪中達到 100% 的勝率。

文｜王吉偉

在國內(nèi)，雖然AutoGPT早在4月份就與國外同步火了，但限于大部分人對其背后的AI Agent缺少了解，開始的反響并不是太熱烈。

直到7月初OpenAI應用人工智能研究負責人Lilian Weng那篇關于AI Agent的博文刷爆AI圈后，媒體圈、學研界、投資領域才真正開始熱烈討論AI Agent。

由此國內(nèi)真正開啟了探索與研究AI Agent的熱潮，并且也有一些廠商開始以AI Agent模式重構產(chǎn)品架構與商業(yè)模式。

隨著AI Agent原理、模式以及構建方式越發(fā)明朗，很多受困于技術、模式、生態(tài)乃至政策的創(chuàng)業(yè)者都是眼前一亮。

而大公司一邊，面對大型科技公司和創(chuàng)業(yè)公司都有可能抓住這次Agent的機會，比爾蓋茨也表示如果微軟沒有介入他會感到失望。

從AI Agent說起

這樣，提示工程也就成了橫亙在普通人與大模型之間的一座大山。

如何更好地解決這個問題呢？答案正是AI Agent（國內(nèi)稱作AI智能體）。

而在LLM到來之后，AI Agent就被定義為基于LLM驅(qū)動的Agent實現(xiàn)對通用問題的自動化處理。

比如讓ChatGPT買一杯咖啡，ChatGPT給出的反饋一般類似“無法購買咖啡，它只是一個文字AI助手”之類的回答。

雖然AI工具和Agent都是旨在自動化任務的軟件程序，但特定的關鍵特征將AI智能體區(qū)分為更復雜的AI 軟件。

當AI工具具有以下特征時，就可以將該工具視為AI Agent:

自治（Autonomy）：AI 虛擬智能體能夠獨立執(zhí)行任務，而無需人工干預或輸入。
知覺（Perception）：智能體功能通過各種傳感器（如攝像頭或麥克風）感知和解釋它們所處的環(huán)境。
反應（Reactivity）：AI 智能體可以評估環(huán)境并做出相應的響應以實現(xiàn)其目標。
推理和決策（Reasoning and decision-making）：AI 智能體是智能工具，可以分析數(shù)據(jù)并做出決策以實現(xiàn)目標。他們使用推理技術和算法來處理信息并采取適當?shù)男袆印?/li>
學習（Learning）：他們可以通過機器、深度和強化學習元素和技術來學習和提高他們的表現(xiàn)。
通信（Communication）：AI 智能體可以使用不同的方法與其他智能體或人類進行通信，例如理解和響應自然語言、識別語音以及通過文本交換消息。
以目標為導向（Goal-oriented）：它們旨在實現(xiàn)特定目標，這些目標可以通過與環(huán)境的交互來預定義或?qū)W習。

在類別上，AI智能體分目前可分為自主智能體（Autonomous Agent）和生成智能體（Generative Agent）。

說了這么多，很多朋友可能仍對AI智能體沒有直觀的感受。不要著急，下文我們將通過一個對比案例來加深大家的認知。

Ai 智能體滲透各領域

AiAgent.app是一個Web 應用，它允許用戶創(chuàng)建自定義AI智能體以執(zhí)行特定任務并實現(xiàn)目標。

下面王吉偉頻道將通過使用Ai智能體與直接使用LLM的對比體驗，看看AI智能體的優(yōu)勢。

比如想了解過去一個月AI行業(yè)的新聞和趨勢，在Claude輸入：過去一個月人工智能行業(yè)最新新聞和趨勢的摘要。

可以看到，Claude只是列出了幾條與AI相關的新聞資訊摘要。

而在AiAgent.app只需要輸入一句話，它就分析出了你可能的需求并列出相對全面的內(nèi)容目標，引導你去完成想要的東西，效率提升數(shù)倍。

全球60個AI Agent大盤點

本文所盤點的AI Agents，既包括AI Agents框架及工具，也包括基于一些開源框架打造的AGENT產(chǎn)品，同時大部分項目及產(chǎn)品都為自主智能體。

一、媒體報道的AI Agent

1、Auto-GPT

Auto GPT是Github上的一個免費開源項目，結合了GPT-4和GPT-3.5技術，通過API創(chuàng)建完整的項目。

Auto-GPT是GPT-4完全自主運行的首批示例之一，它突破了人工智能所能做的界限。

2、AgentGPT

3、Baby AGI

Baby AGI的吸引力在于它能夠根據(jù)先前任務的結果自主解決任務并保持預定義的目標，還能有效地確定任務的優(yōu)先級。

4、Jarvis （HuggingGPT）

5、Aiagent.app

6、Camel AGI

7、“Westworld” simulation西部世界小鎮(zhèn)

8、GPT-Engineer

9、MetaGPT

10、Amazon Bedrock Agents

11、nvidia Voyager

12、RoboAgent

13、Inflection AI Pi

14、HyperWrite

15、GPT Researcher

國內(nèi)已推出的AI Agent

經(jīng)過持續(xù)探索與嘗試，國內(nèi)AI智能體相關的產(chǎn)品也開始嶄露頭角，下面介紹五款產(chǎn)品。

1、阿里云ModelScopeGPT

2、實在智能TARS-RPA-Agent

3、OmBot歐姆智能體

4、瀾碼科技Ask XBot

5、ChatDev

ChatDev的主要目的是通過聊天來進行游戲開發(fā)。用戶只需提出想法，從設計到測試的整個流程都由AI完成，整個過程只需七分鐘即可完成。

面向不同領域的AI Agent產(chǎn)品

LLM還沒有出現(xiàn)之前，一些企業(yè)就已在研究傳統(tǒng)AI與Agent的結合應用。因此，AI Agenmt在各領域的落地比大家預想得要快很多。

下面，是幾個行業(yè)領域的代表性Agent應用。

在醫(yī)療領域，Agent可以幫助診斷、治療和監(jiān)測患者。IBM Watson Health 是一個AI智能體，可以分析醫(yī)療數(shù)據(jù)，以識別潛在的健康問題并推薦治療方案。
在金融領域，Agent可以分析財務數(shù)據(jù)、檢測欺詐行為并提出投資建議。嘉信理財（Charles Schwab）使用名為Intelligent Portfolio的人工智能智能體，根據(jù)客戶的投資目標創(chuàng)建和管理投資組合。
在零售業(yè)務場景中，Agent可以提供個性化推薦，改善供應鏈管理，增強客戶體驗。亞馬遜的Alexa是一個AI智能體，可以推薦產(chǎn)品，下訂單和跟蹤發(fā)貨。
在制造業(yè)，Agent可以優(yōu)化生產(chǎn)流程，預測維護需求，提高產(chǎn)品質(zhì)量。通用電氣使用名為Predix的AI智能體實時監(jiān)控機器，以預測和防止設備故障。
在運輸領域，自主AI Agent可以協(xié)助路線規(guī)劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動駕駛車輛，并幫助駕駛員停車、變道和安全駕駛。
在教育行業(yè)，Agnet可以提供個性化的學習體驗，自動執(zhí)行管理任務并分析學生的表現(xiàn)。培生（Pearson）的AI智能體Aida可以為學生提供反饋，并建議個性化的學習路徑。
在農(nóng)業(yè)領域，AI Agent可以優(yōu)化作物生產(chǎn)、監(jiān)測土壤質(zhì)量并預測天氣模式。約翰迪爾（John Deere）正在使用一種名為See&Spray的AI智能體來檢測和定位雜草，而不會影響作物。

海外已推出其他AGENT產(chǎn)品

1、Cognosys

Cognosys是基于Web的AI智能體，旨在徹底改變生產(chǎn)力并簡化復雜任務，使用最先進的 AI 技術提升您的日常生活。

2、Doanythingmachine

使用“無所不能”機器輕松管理您的任務，用戶個人AI 智能體將為您確定優(yōu)先級并完成您的任務

3、alphakit

4、GPTConsole

5、Fini

提供指向知識庫的鏈接，在2分鐘內(nèi)將您的知識庫轉(zhuǎn)換為AI聊天。Fini為用戶提供一個不知疲倦的AI智能體，隨時準備24/7立即回答客戶問題。

6、Spell

7、Aomni

Aomni的查詢規(guī)劃器基于當前最先進的AutoGPT架構，智能地計劃和更新每個請求，以確保來源的正確性和多樣性。

8、Fine-Tuner.ai

9、SuperAGI

一個開源的自主AI框架，使您能夠快速可靠地開發(fā)和部署有用的自主智能體，用于構建、管理和運行自主智能體的基礎結構。

10、Yellow.ai

11、Godmode

使用戶能夠在瀏覽器中運行AutoGPT。Godmode允許用戶同時部署多個AI智能體以使用AI 完成任務，用戶也可以使用自己的OpenAI API密鑰。

12、E42

13、Thankful

14、Aktify

15、TeamSmart AI

16、BrainstormGPT

17、AgentRunner.Ai

18、Gista

19、Agent4

Agent4的主要功能之一是能夠創(chuàng)建AI驅(qū)動的虛擬智能體，可以回答問題，幫助預訂會議，收聽語音郵件并提供摘要。

20、Cometcore AI

21、personal-assistant

一個人工智能代理，旨在處理從預訂航班到進行深入研究以及介于兩者之間的所有任務。

Github上的AI Agent項目

1、OpenAGI

2、Agent-LLM

Agent-LLM是一個人工智能自動化平臺，旨在為跨多個提供商的高效AI指令管理提供動力。

3、AutoGPT-Next-Web

4、MiniGPT-4

這款Agent，可以使用高級大語言模型增強視覺語言理解。

5、Mini-AGI

6、Teenage-AGI

7、FastGPT

8、DemoGPT

使用DemoGPT，只需使用簡單句子即可快速創(chuàng)建演示。

9、LocalAGI

基于LLMDA、ChatGLM 等模型的本地運行AGI項目。

10、ai-town（游戲類）

11、gptrpg（游戲類）

gptrpg此存儲庫包含兩件事：一個簡單的類似RPG游戲的環(huán)境，用于支持 LLM 的 AI 智能體；連接到 OpenAI API 以存在于該環(huán)境中的簡單 AI 智能體。

12、SFighterAI（游戲類）

歷史搜索全部刪除

熱門搜索

全球AI Agent大盤點，大語言模型創(chuàng)業(yè)一定要參考的60個AI智能體

Ai 智能體滲透各領域

全球60個AI Agent大盤點

OpenAI

評論

全球AI Agent大盤點，大語言模型創(chuàng)業(yè)一定要參考的60個AI智能體

Ai 智能體滲透各領域

全球60個AI Agent大盤點

全球AI Agent大盤點，大語言模型創(chuàng)業(yè)一定要參考的60個AI智能體

Ai 智能體滲透各領域

全球60個AI Agent大盤點

OpenAI

評論

全球AI Agent大盤點，大語言模型創(chuàng)業(yè)一定要參考的60個AI智能體

Ai 智能體滲透各領域

全球60個AI Agent大盤點

全球AI Agent大盤點，大語言模型創(chuàng)業(yè)一定要參考的60個AI智能體