正在閱讀:

RPA終極發(fā)展方向瞄準(zhǔn)AI Agent,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向?

掃一掃下載界面新聞APP

RPA終極發(fā)展方向瞄準(zhǔn)AI Agent,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向?

大語言模型時(shí)代,AI Agent火速影響自動(dòng)化領(lǐng)域,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向。

文|王吉偉

  • 大語言模型時(shí)代,AI Agent影響下RPA發(fā)展的四個(gè)階段
  • AI Agent火速影響自動(dòng)化領(lǐng)域,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向
  • 自主智能體成為新一代自動(dòng)化,對(duì)超自動(dòng)化領(lǐng)域有什么影響?
  • 持續(xù)進(jìn)化的RPA,在大模型時(shí)代搭上了AI Agent的東風(fēng)
  • 發(fā)展方向劍指自主智能體,借助AI Agent走向AGI成RPA終極目標(biāo)
  • RPA終極發(fā)展方向瞄準(zhǔn)AI Agent,超自動(dòng)化智能體時(shí)代已經(jīng)開啟

RPA之所以如此受歡迎,是因?yàn)樗婕笆褂谩皺C(jī)器人”來自動(dòng)化通常由員工完成的大批量、低復(fù)雜性及重復(fù)性任務(wù)。

RPA的基本情況很明確,這些機(jī)器人解放了員工,讓他們專注于更多增值任務(wù),并降低企業(yè)的總體成本。它們可以每天 24 小時(shí)運(yùn)行,避免人為錯(cuò)誤,并處理大量任務(wù)。

適合RPA的任務(wù)包括處理事務(wù)、操作數(shù)據(jù)、響應(yīng)查詢和跨系統(tǒng)通信。管理后臺(tái)對(duì)于RPA高效應(yīng)用,也證明了其與該技術(shù)的天然契合,比如銀行實(shí)施RPA來路由和回復(fù)投訴電子郵件,醫(yī)療保健公司使用RPA“機(jī)器人”來幫助處理和分析數(shù)百萬張供應(yīng)商發(fā)票等。

長期以來,對(duì)于異構(gòu)系統(tǒng)且雜亂的傳統(tǒng)自動(dòng)化技術(shù),RPA就像一顆銀彈,它的連接性使得很多企業(yè)往日投資的自動(dòng)化技術(shù)得以煥發(fā)青春。

因此,RPA在金融服務(wù)、公共部門和能源等高度監(jiān)管的領(lǐng)域得到了顯著的應(yīng)用,當(dāng)然前提在于這些部門往往不愿意或無法對(duì)其系統(tǒng)進(jìn)行大規(guī)模改變。

不只在這些領(lǐng)域,很多實(shí)施數(shù)字化技術(shù)多年的大型企業(yè)都存在這種情況,面向傳統(tǒng)自動(dòng)化難以為繼、不想讓過往投資付之一炬以及不想繼續(xù)大量投資技術(shù)的種種需求,RPA從未變得如此受歡迎。

難解決的問題

即便RPA近幾年都以超過16%復(fù)合增長率快速成長,因?yàn)樗倪B接特性,始終被一些人戲稱為“創(chuàng)可貼”或者“粘結(jié)劑”。

這兩個(gè)綽號(hào),恰恰反映了RPA不夠穩(wěn)定的缺點(diǎn)。很多客戶抱怨機(jī)器人很脆弱,需要花費(fèi)數(shù)小時(shí)來維護(hù)它們,而不是構(gòu)建新的自動(dòng)化。對(duì)很多業(yè)務(wù)場(chǎng)景來說,如果數(shù)據(jù)樣式發(fā)生變化,例如在表單中添加了新項(xiàng)目,機(jī)器人就無法繼續(xù)工作了,必須重新配置任務(wù)。

業(yè)務(wù)人員加一筆,維護(hù)人員跑斷腿。

正是因?yàn)镽PA構(gòu)建業(yè)務(wù)流程自動(dòng)化的脆弱性,廠商們紛紛引入AI技術(shù),并進(jìn)一步向能夠構(gòu)建端到端自動(dòng)化的超自動(dòng)化架構(gòu)發(fā)展。

超自動(dòng)化是一個(gè)以交付工作為目的集合體,通過吸納更多的技術(shù)打造一個(gè)自動(dòng)化產(chǎn)品與技術(shù)集,是RPA、流程挖掘、智能業(yè)務(wù)流程管理等多種技術(shù)能力與軟件工具的組合,也是智能流程自動(dòng)化、集成自動(dòng)化等概念的進(jìn)一步延伸。

超級(jí)自動(dòng)化本身涉及到的關(guān)鍵步驟即發(fā)現(xiàn)、分析、設(shè)計(jì)、自動(dòng)化、測(cè)量、監(jiān)視和重新評(píng)估等均囊括在內(nèi),突出以人為中心,實(shí)現(xiàn)人、應(yīng)用、服務(wù)之間的關(guān)聯(lián)、組合以及協(xié)調(diào)的重要性。

雖然超自動(dòng)化在架構(gòu)中引入了測(cè)量、監(jiān)視和重新評(píng)估,但RPA仍舊處于相對(duì)獨(dú)立的運(yùn)行單元。即便早已引入的AI技術(shù),也難以保障RPA在業(yè)務(wù)靈活需求場(chǎng)景下運(yùn)行穩(wěn)定性。

直到今年大語言模型實(shí)現(xiàn)重大突破,AI Agent與RPA的結(jié)合才真正讓大家看到了希望。

RPA的Agent機(jī)遇

現(xiàn)在幾乎所有技術(shù)供應(yīng)商與組織都在轉(zhuǎn)向大語言模型(LLM),隨著更多廠商的不斷探索與嘗試,我們看到一種新型自動(dòng)化正在興起,它就是自主智能體(Autonomous Agent,AI Agent的一種)。

AI Agent(AI智能體)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。不同于傳統(tǒng)的AI,AI Agent 具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。

AI Agent 的工作僅需給定一個(gè)目標(biāo),就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng),它會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來自外界的反饋和自主思考,為自己創(chuàng)建 prompt以實(shí)現(xiàn)目標(biāo)。

在類別上,AI智能體分目前可分為自主智能體(Autonomous Agent)和生成智能體(Generative Agent)。自主智能體如Auto-GPT,能夠根據(jù)人們通過自然語言提出的需求,自動(dòng)執(zhí)行任務(wù)并實(shí)現(xiàn)預(yù)期結(jié)果。在這種合作模式下,自主智能體主要是為人類服務(wù),更像是一個(gè)高效的工具。

AI智能體可以使用GPT-4等大型語言模型規(guī)劃和執(zhí)行用戶提供的目標(biāo)。這些機(jī)器人完成并添加新任務(wù),根據(jù)先前任務(wù)的結(jié)果確定其工作流的優(yōu)先級(jí)。它們可以調(diào)用長期和短期記憶,使用舊查詢作為上下文并存儲(chǔ)以前的結(jié)果。

這意味著這些機(jī)器人不會(huì)停在新數(shù)據(jù)導(dǎo)致的“死胡同”,而是可以從錯(cuò)誤中“學(xué)習(xí)”并調(diào)整其一系列任務(wù)。

Github等開源社區(qū)現(xiàn)在已經(jīng)出現(xiàn)從編寫代碼(GPT-Engineer)到訂購披薩(HyperWrite)的多種智能體框架及工具,目前單是開源Agent架構(gòu)就有AutoGPT、BabyGPT、MetaGPT等多個(gè),開發(fā)者們可以用這些架構(gòu)打造各領(lǐng)域及業(yè)務(wù)場(chǎng)景的基于LLM的AI智能體。

在海外,投研界已將自主智能體稱作新一代自動(dòng)化。

新一代自動(dòng)化

大多數(shù)RPA廠商,都在以生成式AI補(bǔ)充RPA為中心的自動(dòng)化流程,比如更好的文檔處理或代碼原生平臺(tái)等。像UiPath和Automation Anywhere等廠商,正在通過更多的端到端自動(dòng)化工作流程以及添加支持生成式AI的功能,以應(yīng)對(duì)傳統(tǒng)RPA的缺點(diǎn)。

當(dāng)然,也不排除一些廠商會(huì)基于AI Agent重新構(gòu)建超自動(dòng)化產(chǎn)品。

比如最近專注低代碼的超自動(dòng)化廠商Torq已將其AI代理添加到安全超自動(dòng)化平臺(tái),國產(chǎn)超自動(dòng)化廠商實(shí)在智能也在8月份推出了基于自研大語言模型TARS的RPA智能體產(chǎn)品TARS-RPA-Agent。

這些廠商,已經(jīng)成為流程自動(dòng)化領(lǐng)域探索AI Agent的先行者。

而一些新的創(chuàng)業(yè)公司,則以自主智能體為中心提供“新一代流程自動(dòng)化”工具,這些工具的應(yīng)用通常從電子商務(wù)等不受監(jiān)管的領(lǐng)域及業(yè)務(wù)場(chǎng)景開始。

下面一些廠商,是來自歐洲已推出AI智能體產(chǎn)品的佼佼者。

  • Robocorp:代碼原生和開源RPA平臺(tái),其愿景是通過GenAI代碼解釋器將Python的靈活性與低代碼的易用性相結(jié)合;
  • DeepOpinion:采用尖端NLP實(shí)現(xiàn)企業(yè)工作流程自動(dòng)化;
  • Automaited:高度靈活的自動(dòng)化,適用于任何任務(wù),具有自學(xué)功能;
  • Workfellow:通過插入各種工作流程實(shí)現(xiàn)下一代流程卓越;
  • Levity:用于電子郵件、調(diào)查、客戶支持等的AI文本和文檔處理;
  • Invofox:人工智能數(shù)據(jù)輸入,最初關(guān)注賬單和發(fā)票等財(cái)務(wù);
  • Go Autonomous:在報(bào)價(jià)和銷售訂單等領(lǐng)域以電子商務(wù)為重點(diǎn)的自動(dòng)化;
  • Virtuoso:使用NLP和AI進(jìn)行QA和測(cè)試自動(dòng)化以減少維護(hù)開銷;
  • Workist:使用AI實(shí)現(xiàn)B2B交易的訂單處理自動(dòng)化。

RPA的持續(xù)進(jìn)化

當(dāng)代RPA的興起以及快速發(fā)展,得益于人工智能技術(shù)。伴隨著AI的不斷突破,RPA從技術(shù)架構(gòu)到功能也在不斷進(jìn)化。如今大語言模型的突破與應(yīng)用,也為RPA的未來發(fā)展帶來了新的發(fā)展方向。

從智能流程自動(dòng)化(IPA)的進(jìn)化角度,數(shù)字化轉(zhuǎn)型博客DeltalogiX 將IPA的進(jìn)化發(fā)展分為四個(gè)階段,分別是RPA、認(rèn)知自動(dòng)化(Cognitive Automation)、數(shù)字助手(Digital Assistants)和自主智能體(Autonomous Agents)。

第一階段:用于簡單、重復(fù)性任務(wù)的RPA

每個(gè)員工每天都在執(zhí)行簡單的日常任務(wù),經(jīng)常占據(jù)一天中的很大工作部分。RPA非常適合涉及結(jié)構(gòu)化數(shù)據(jù)的重復(fù)性任務(wù),比如閱讀電子郵件等都可以交給RPA。

RPA機(jī)器人遵循預(yù)定義的規(guī)則和說明。使用確定性RPA機(jī)器人的自動(dòng)化流程的一個(gè)案例是處理員工費(fèi)用報(bào)銷單。通常,此過程要求員工填寫包含所有必要信息的紙質(zhì)或電子表格,并將其發(fā)送給人力資源或行政部門進(jìn)行審查和批準(zhǔn)。

第二階段:用于培訓(xùn)和過程適應(yīng)的認(rèn)知自動(dòng)化Cognitive Automation

經(jīng)過人工智能技術(shù)的加持,RPA就進(jìn)化成為IPA,也就是我們所說的認(rèn)知自動(dòng)化。除了基于規(guī)則和說明的結(jié)構(gòu)化數(shù)據(jù),IPA能處理的數(shù)據(jù)可來自于電子郵件、文檔和圖像,

認(rèn)知自動(dòng)化基于對(duì)過去經(jīng)驗(yàn)的分析,通過不斷整合歷史數(shù)據(jù)和新數(shù)據(jù),自動(dòng)化流程會(huì)適應(yīng)收到的反饋,以預(yù)測(cè)產(chǎn)品或服務(wù)的需求為例。使用先進(jìn)的機(jī)器學(xué)習(xí)算法和對(duì)歷史銷售數(shù)據(jù)的訪問,可以創(chuàng)建一個(gè)預(yù)測(cè)模型來分析過去的模式,以識(shí)別趨勢(shì)和行為。

還可以訓(xùn)練模型以了解影響需求的變量,例如季節(jié)性、促銷、特殊事件和經(jīng)濟(jì)狀況。這些預(yù)測(cè)可用于指導(dǎo)業(yè)務(wù)決策,例如生產(chǎn)計(jì)劃、庫存管理、定義營銷策略和預(yù)測(cè)資源需求。此過程的認(rèn)知自動(dòng)化可實(shí)現(xiàn)比手動(dòng)數(shù)據(jù)分析更準(zhǔn)確、更高效的預(yù)測(cè)。

此外,由于該模型可以使用新數(shù)據(jù)不斷訓(xùn)練,因此它可以適應(yīng)市場(chǎng)變化并隨著時(shí)間的推移而改進(jìn)??梢钥闯觯词故巧倭康娜斯ぶ悄芤部梢燥@著提高自主性水平,并為更復(fù)雜的流程提供更具體的支持。

第三階段:用于語言處理的數(shù)字助理Digital Assistants

隨著IPA與AI的深度融合,尤其是有了LLM的支持,IPA發(fā)展成為了真正基于自然語言交互的數(shù)字助理。

像ChatGPT就是典型的數(shù)字助理,其他廠商也可以借助GPT等LLM構(gòu)建面向其所在領(lǐng)域的數(shù)字助理。

認(rèn)知自動(dòng)化系統(tǒng)能夠理解和處理人類語言(NLP,自然語言處理)。因此人力資源將能夠與軟件進(jìn)行交互,而軟件又將能夠從書面或口頭文本中提取含義并提供“智能”響應(yīng)。NLP 可實(shí)現(xiàn)與聊天機(jī)器人、語音助手和基于語言的分析相關(guān)的任務(wù)的自動(dòng)化。

語言理解和用戶界面也是允許客戶以自動(dòng)化方式與公司互動(dòng)的重要元素。如果使用得當(dāng),并采用改善客戶體驗(yàn)的策略,虛擬助手可以通過減少相關(guān)活動(dòng)所需的時(shí)間來高效改善工作和與客戶的關(guān)系。

第四階段:用于決策的自主智能體Autonomous Agents

最高水平的智能自動(dòng)化涉及復(fù)雜的決策過程。在這個(gè)過程中,深度數(shù)據(jù)分析(包括深度學(xué)習(xí))提供了廣泛的概述,在此基礎(chǔ)上進(jìn)行分析或預(yù)測(cè)以指導(dǎo)短期和長期活動(dòng)。

這種深入的分析功能包括多個(gè)變量和相關(guān)因素,允許機(jī)器人或者更確切地說是數(shù)字智能體自主做出決策。

這種類型的支持特別適用于人力資源管理、供應(yīng)鏈優(yōu)化、財(cái)務(wù)規(guī)劃和風(fēng)險(xiǎn)分析。由于其不斷增加的處理能力和知識(shí),該機(jī)器人能夠提供及時(shí)準(zhǔn)確的建議和建議,以支持業(yè)務(wù)主管的決策過程。

后記:超自動(dòng)化智能體時(shí)代到來

可以看到,第四階段的自主智能體正好對(duì)應(yīng)于前文講的新一代自動(dòng)化。

按照IPA的發(fā)展路徑,這里第四階段的自主智能體,更多的指的是基于LLM的RPA智能體或者超自動(dòng)化智能體。

畢竟,立足流程自動(dòng)化的RPA廠商們,一般不會(huì)放棄現(xiàn)有產(chǎn)品形態(tài),以自主智能體為中心去開拓全新的AI Agent產(chǎn)品體系。

短時(shí)間內(nèi),AI Agent還無法用于操作成百上千的企業(yè)管理系統(tǒng)。更大的可能是,企業(yè)級(jí)運(yùn)營管理層面的自主智能體,將由更懂企業(yè)經(jīng)營的RPA、流程挖掘、BPA、ERP等企管軟件廠商,在不同LLM和已有管理軟件基礎(chǔ)上構(gòu)建。

所以,廠商們?cè)谧匝蠰LM及現(xiàn)有產(chǎn)品架構(gòu)中引入AI Agent,或者開辟一條AI Agent能夠聯(lián)動(dòng)已有自動(dòng)化技術(shù)的產(chǎn)品路線是完全有可能的。

且智能體也已成為RPA未來發(fā)展終極目標(biāo),而AI智能體也是通往通用人工智能(AGI)的必經(jīng)之路。

事實(shí)上,就是廠商們不去做AI Agent融合,出于降本增效提質(zhì)的需求,客戶也會(huì)自行在已引入LLM及RPA的基礎(chǔ)上去做進(jìn)一步探索。在市場(chǎng)上需求的牽引下,技術(shù)供應(yīng)商們?cè)缤矶紩?huì)邁出智能體這一步。

今年大模型開始流行之后,隨著RPA廠商們紛紛引入生成式AI,目前主流廠商都已發(fā)展到第三階段數(shù)字助手,少部分廠商則已經(jīng)開啟了第四階段對(duì)AI智能體的探索。

據(jù)王吉偉頻道了解,國內(nèi)已有數(shù)家RPA廠商著手這方面的研究,應(yīng)該很快也能推出相應(yīng)產(chǎn)品。

Gartner表示,到2025年,90%的RPA供應(yīng)商,將提供生成式AI輔助的自動(dòng)化服務(wù)。同時(shí)在生成式AI加持影響下,RPA市場(chǎng)將繼續(xù)保持高速增長。

從IPA的發(fā)展趨勢(shì)而言,今后每一家RPA廠商及超自動(dòng)化廠商都有可能進(jìn)化為RPA\超自動(dòng)化智能體。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

RPA終極發(fā)展方向瞄準(zhǔn)AI Agent,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向?

大語言模型時(shí)代,AI Agent火速影響自動(dòng)化領(lǐng)域,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向。

文|王吉偉

  • 大語言模型時(shí)代,AI Agent影響下RPA發(fā)展的四個(gè)階段
  • AI Agent火速影響自動(dòng)化領(lǐng)域,自主智能體成為超自動(dòng)化發(fā)展新風(fēng)向
  • 自主智能體成為新一代自動(dòng)化,對(duì)超自動(dòng)化領(lǐng)域有什么影響?
  • 持續(xù)進(jìn)化的RPA,在大模型時(shí)代搭上了AI Agent的東風(fēng)
  • 發(fā)展方向劍指自主智能體,借助AI Agent走向AGI成RPA終極目標(biāo)
  • RPA終極發(fā)展方向瞄準(zhǔn)AI Agent,超自動(dòng)化智能體時(shí)代已經(jīng)開啟

RPA之所以如此受歡迎,是因?yàn)樗婕笆褂谩皺C(jī)器人”來自動(dòng)化通常由員工完成的大批量、低復(fù)雜性及重復(fù)性任務(wù)。

RPA的基本情況很明確,這些機(jī)器人解放了員工,讓他們專注于更多增值任務(wù),并降低企業(yè)的總體成本。它們可以每天 24 小時(shí)運(yùn)行,避免人為錯(cuò)誤,并處理大量任務(wù)。

適合RPA的任務(wù)包括處理事務(wù)、操作數(shù)據(jù)、響應(yīng)查詢和跨系統(tǒng)通信。管理后臺(tái)對(duì)于RPA高效應(yīng)用,也證明了其與該技術(shù)的天然契合,比如銀行實(shí)施RPA來路由和回復(fù)投訴電子郵件,醫(yī)療保健公司使用RPA“機(jī)器人”來幫助處理和分析數(shù)百萬張供應(yīng)商發(fā)票等。

長期以來,對(duì)于異構(gòu)系統(tǒng)且雜亂的傳統(tǒng)自動(dòng)化技術(shù),RPA就像一顆銀彈,它的連接性使得很多企業(yè)往日投資的自動(dòng)化技術(shù)得以煥發(fā)青春。

因此,RPA在金融服務(wù)、公共部門和能源等高度監(jiān)管的領(lǐng)域得到了顯著的應(yīng)用,當(dāng)然前提在于這些部門往往不愿意或無法對(duì)其系統(tǒng)進(jìn)行大規(guī)模改變。

不只在這些領(lǐng)域,很多實(shí)施數(shù)字化技術(shù)多年的大型企業(yè)都存在這種情況,面向傳統(tǒng)自動(dòng)化難以為繼、不想讓過往投資付之一炬以及不想繼續(xù)大量投資技術(shù)的種種需求,RPA從未變得如此受歡迎。

難解決的問題

即便RPA近幾年都以超過16%復(fù)合增長率快速成長,因?yàn)樗倪B接特性,始終被一些人戲稱為“創(chuàng)可貼”或者“粘結(jié)劑”。

這兩個(gè)綽號(hào),恰恰反映了RPA不夠穩(wěn)定的缺點(diǎn)。很多客戶抱怨機(jī)器人很脆弱,需要花費(fèi)數(shù)小時(shí)來維護(hù)它們,而不是構(gòu)建新的自動(dòng)化。對(duì)很多業(yè)務(wù)場(chǎng)景來說,如果數(shù)據(jù)樣式發(fā)生變化,例如在表單中添加了新項(xiàng)目,機(jī)器人就無法繼續(xù)工作了,必須重新配置任務(wù)。

業(yè)務(wù)人員加一筆,維護(hù)人員跑斷腿。

正是因?yàn)镽PA構(gòu)建業(yè)務(wù)流程自動(dòng)化的脆弱性,廠商們紛紛引入AI技術(shù),并進(jìn)一步向能夠構(gòu)建端到端自動(dòng)化的超自動(dòng)化架構(gòu)發(fā)展。

超自動(dòng)化是一個(gè)以交付工作為目的集合體,通過吸納更多的技術(shù)打造一個(gè)自動(dòng)化產(chǎn)品與技術(shù)集,是RPA、流程挖掘、智能業(yè)務(wù)流程管理等多種技術(shù)能力與軟件工具的組合,也是智能流程自動(dòng)化、集成自動(dòng)化等概念的進(jìn)一步延伸。

超級(jí)自動(dòng)化本身涉及到的關(guān)鍵步驟即發(fā)現(xiàn)、分析、設(shè)計(jì)、自動(dòng)化、測(cè)量、監(jiān)視和重新評(píng)估等均囊括在內(nèi),突出以人為中心,實(shí)現(xiàn)人、應(yīng)用、服務(wù)之間的關(guān)聯(lián)、組合以及協(xié)調(diào)的重要性。

雖然超自動(dòng)化在架構(gòu)中引入了測(cè)量、監(jiān)視和重新評(píng)估,但RPA仍舊處于相對(duì)獨(dú)立的運(yùn)行單元。即便早已引入的AI技術(shù),也難以保障RPA在業(yè)務(wù)靈活需求場(chǎng)景下運(yùn)行穩(wěn)定性。

直到今年大語言模型實(shí)現(xiàn)重大突破,AI Agent與RPA的結(jié)合才真正讓大家看到了希望。

RPA的Agent機(jī)遇

現(xiàn)在幾乎所有技術(shù)供應(yīng)商與組織都在轉(zhuǎn)向大語言模型(LLM),隨著更多廠商的不斷探索與嘗試,我們看到一種新型自動(dòng)化正在興起,它就是自主智能體(Autonomous Agent,AI Agent的一種)。

AI Agent(AI智能體)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。不同于傳統(tǒng)的AI,AI Agent 具備通過獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力。

AI Agent 的工作僅需給定一個(gè)目標(biāo),就能夠針對(duì)目標(biāo)獨(dú)立思考并做出行動(dòng),它會(huì)根據(jù)給定任務(wù)詳細(xì)拆解出每一步的計(jì)劃步驟,依靠來自外界的反饋和自主思考,為自己創(chuàng)建 prompt以實(shí)現(xiàn)目標(biāo)。

在類別上,AI智能體分目前可分為自主智能體(Autonomous Agent)和生成智能體(Generative Agent)。自主智能體如Auto-GPT,能夠根據(jù)人們通過自然語言提出的需求,自動(dòng)執(zhí)行任務(wù)并實(shí)現(xiàn)預(yù)期結(jié)果。在這種合作模式下,自主智能體主要是為人類服務(wù),更像是一個(gè)高效的工具。

AI智能體可以使用GPT-4等大型語言模型規(guī)劃和執(zhí)行用戶提供的目標(biāo)。這些機(jī)器人完成并添加新任務(wù),根據(jù)先前任務(wù)的結(jié)果確定其工作流的優(yōu)先級(jí)。它們可以調(diào)用長期和短期記憶,使用舊查詢作為上下文并存儲(chǔ)以前的結(jié)果。

這意味著這些機(jī)器人不會(huì)停在新數(shù)據(jù)導(dǎo)致的“死胡同”,而是可以從錯(cuò)誤中“學(xué)習(xí)”并調(diào)整其一系列任務(wù)。

Github等開源社區(qū)現(xiàn)在已經(jīng)出現(xiàn)從編寫代碼(GPT-Engineer)到訂購披薩(HyperWrite)的多種智能體框架及工具,目前單是開源Agent架構(gòu)就有AutoGPT、BabyGPT、MetaGPT等多個(gè),開發(fā)者們可以用這些架構(gòu)打造各領(lǐng)域及業(yè)務(wù)場(chǎng)景的基于LLM的AI智能體。

在海外,投研界已將自主智能體稱作新一代自動(dòng)化。

新一代自動(dòng)化

大多數(shù)RPA廠商,都在以生成式AI補(bǔ)充RPA為中心的自動(dòng)化流程,比如更好的文檔處理或代碼原生平臺(tái)等。像UiPath和Automation Anywhere等廠商,正在通過更多的端到端自動(dòng)化工作流程以及添加支持生成式AI的功能,以應(yīng)對(duì)傳統(tǒng)RPA的缺點(diǎn)。

當(dāng)然,也不排除一些廠商會(huì)基于AI Agent重新構(gòu)建超自動(dòng)化產(chǎn)品。

比如最近專注低代碼的超自動(dòng)化廠商Torq已將其AI代理添加到安全超自動(dòng)化平臺(tái),國產(chǎn)超自動(dòng)化廠商實(shí)在智能也在8月份推出了基于自研大語言模型TARS的RPA智能體產(chǎn)品TARS-RPA-Agent。

這些廠商,已經(jīng)成為流程自動(dòng)化領(lǐng)域探索AI Agent的先行者。

而一些新的創(chuàng)業(yè)公司,則以自主智能體為中心提供“新一代流程自動(dòng)化”工具,這些工具的應(yīng)用通常從電子商務(wù)等不受監(jiān)管的領(lǐng)域及業(yè)務(wù)場(chǎng)景開始。

下面一些廠商,是來自歐洲已推出AI智能體產(chǎn)品的佼佼者。

  • Robocorp:代碼原生和開源RPA平臺(tái),其愿景是通過GenAI代碼解釋器將Python的靈活性與低代碼的易用性相結(jié)合;
  • DeepOpinion:采用尖端NLP實(shí)現(xiàn)企業(yè)工作流程自動(dòng)化;
  • Automaited:高度靈活的自動(dòng)化,適用于任何任務(wù),具有自學(xué)功能;
  • Workfellow:通過插入各種工作流程實(shí)現(xiàn)下一代流程卓越;
  • Levity:用于電子郵件、調(diào)查、客戶支持等的AI文本和文檔處理;
  • Invofox:人工智能數(shù)據(jù)輸入,最初關(guān)注賬單和發(fā)票等財(cái)務(wù);
  • Go Autonomous:在報(bào)價(jià)和銷售訂單等領(lǐng)域以電子商務(wù)為重點(diǎn)的自動(dòng)化;
  • Virtuoso:使用NLP和AI進(jìn)行QA和測(cè)試自動(dòng)化以減少維護(hù)開銷;
  • Workist:使用AI實(shí)現(xiàn)B2B交易的訂單處理自動(dòng)化。

RPA的持續(xù)進(jìn)化

當(dāng)代RPA的興起以及快速發(fā)展,得益于人工智能技術(shù)。伴隨著AI的不斷突破,RPA從技術(shù)架構(gòu)到功能也在不斷進(jìn)化。如今大語言模型的突破與應(yīng)用,也為RPA的未來發(fā)展帶來了新的發(fā)展方向。

從智能流程自動(dòng)化(IPA)的進(jìn)化角度,數(shù)字化轉(zhuǎn)型博客DeltalogiX 將IPA的進(jìn)化發(fā)展分為四個(gè)階段,分別是RPA、認(rèn)知自動(dòng)化(Cognitive Automation)、數(shù)字助手(Digital Assistants)和自主智能體(Autonomous Agents)。

第一階段:用于簡單、重復(fù)性任務(wù)的RPA

每個(gè)員工每天都在執(zhí)行簡單的日常任務(wù),經(jīng)常占據(jù)一天中的很大工作部分。RPA非常適合涉及結(jié)構(gòu)化數(shù)據(jù)的重復(fù)性任務(wù),比如閱讀電子郵件等都可以交給RPA。

RPA機(jī)器人遵循預(yù)定義的規(guī)則和說明。使用確定性RPA機(jī)器人的自動(dòng)化流程的一個(gè)案例是處理員工費(fèi)用報(bào)銷單。通常,此過程要求員工填寫包含所有必要信息的紙質(zhì)或電子表格,并將其發(fā)送給人力資源或行政部門進(jìn)行審查和批準(zhǔn)。

第二階段:用于培訓(xùn)和過程適應(yīng)的認(rèn)知自動(dòng)化Cognitive Automation

經(jīng)過人工智能技術(shù)的加持,RPA就進(jìn)化成為IPA,也就是我們所說的認(rèn)知自動(dòng)化。除了基于規(guī)則和說明的結(jié)構(gòu)化數(shù)據(jù),IPA能處理的數(shù)據(jù)可來自于電子郵件、文檔和圖像,

認(rèn)知自動(dòng)化基于對(duì)過去經(jīng)驗(yàn)的分析,通過不斷整合歷史數(shù)據(jù)和新數(shù)據(jù),自動(dòng)化流程會(huì)適應(yīng)收到的反饋,以預(yù)測(cè)產(chǎn)品或服務(wù)的需求為例。使用先進(jìn)的機(jī)器學(xué)習(xí)算法和對(duì)歷史銷售數(shù)據(jù)的訪問,可以創(chuàng)建一個(gè)預(yù)測(cè)模型來分析過去的模式,以識(shí)別趨勢(shì)和行為。

還可以訓(xùn)練模型以了解影響需求的變量,例如季節(jié)性、促銷、特殊事件和經(jīng)濟(jì)狀況。這些預(yù)測(cè)可用于指導(dǎo)業(yè)務(wù)決策,例如生產(chǎn)計(jì)劃、庫存管理、定義營銷策略和預(yù)測(cè)資源需求。此過程的認(rèn)知自動(dòng)化可實(shí)現(xiàn)比手動(dòng)數(shù)據(jù)分析更準(zhǔn)確、更高效的預(yù)測(cè)。

此外,由于該模型可以使用新數(shù)據(jù)不斷訓(xùn)練,因此它可以適應(yīng)市場(chǎng)變化并隨著時(shí)間的推移而改進(jìn)??梢钥闯?,即使是少量的人工智能也可以顯著提高自主性水平,并為更復(fù)雜的流程提供更具體的支持。

第三階段:用于語言處理的數(shù)字助理Digital Assistants

隨著IPA與AI的深度融合,尤其是有了LLM的支持,IPA發(fā)展成為了真正基于自然語言交互的數(shù)字助理。

像ChatGPT就是典型的數(shù)字助理,其他廠商也可以借助GPT等LLM構(gòu)建面向其所在領(lǐng)域的數(shù)字助理。

認(rèn)知自動(dòng)化系統(tǒng)能夠理解和處理人類語言(NLP,自然語言處理)。因此人力資源將能夠與軟件進(jìn)行交互,而軟件又將能夠從書面或口頭文本中提取含義并提供“智能”響應(yīng)。NLP 可實(shí)現(xiàn)與聊天機(jī)器人、語音助手和基于語言的分析相關(guān)的任務(wù)的自動(dòng)化。

語言理解和用戶界面也是允許客戶以自動(dòng)化方式與公司互動(dòng)的重要元素。如果使用得當(dāng),并采用改善客戶體驗(yàn)的策略,虛擬助手可以通過減少相關(guān)活動(dòng)所需的時(shí)間來高效改善工作和與客戶的關(guān)系。

第四階段:用于決策的自主智能體Autonomous Agents

最高水平的智能自動(dòng)化涉及復(fù)雜的決策過程。在這個(gè)過程中,深度數(shù)據(jù)分析(包括深度學(xué)習(xí))提供了廣泛的概述,在此基礎(chǔ)上進(jìn)行分析或預(yù)測(cè)以指導(dǎo)短期和長期活動(dòng)。

這種深入的分析功能包括多個(gè)變量和相關(guān)因素,允許機(jī)器人或者更確切地說是數(shù)字智能體自主做出決策。

這種類型的支持特別適用于人力資源管理、供應(yīng)鏈優(yōu)化、財(cái)務(wù)規(guī)劃和風(fēng)險(xiǎn)分析。由于其不斷增加的處理能力和知識(shí),該機(jī)器人能夠提供及時(shí)準(zhǔn)確的建議和建議,以支持業(yè)務(wù)主管的決策過程。

后記:超自動(dòng)化智能體時(shí)代到來

可以看到,第四階段的自主智能體正好對(duì)應(yīng)于前文講的新一代自動(dòng)化。

按照IPA的發(fā)展路徑,這里第四階段的自主智能體,更多的指的是基于LLM的RPA智能體或者超自動(dòng)化智能體。

畢竟,立足流程自動(dòng)化的RPA廠商們,一般不會(huì)放棄現(xiàn)有產(chǎn)品形態(tài),以自主智能體為中心去開拓全新的AI Agent產(chǎn)品體系。

短時(shí)間內(nèi),AI Agent還無法用于操作成百上千的企業(yè)管理系統(tǒng)。更大的可能是,企業(yè)級(jí)運(yùn)營管理層面的自主智能體,將由更懂企業(yè)經(jīng)營的RPA、流程挖掘、BPA、ERP等企管軟件廠商,在不同LLM和已有管理軟件基礎(chǔ)上構(gòu)建。

所以,廠商們?cè)谧匝蠰LM及現(xiàn)有產(chǎn)品架構(gòu)中引入AI Agent,或者開辟一條AI Agent能夠聯(lián)動(dòng)已有自動(dòng)化技術(shù)的產(chǎn)品路線是完全有可能的。

且智能體也已成為RPA未來發(fā)展終極目標(biāo),而AI智能體也是通往通用人工智能(AGI)的必經(jīng)之路。

事實(shí)上,就是廠商們不去做AI Agent融合,出于降本增效提質(zhì)的需求,客戶也會(huì)自行在已引入LLM及RPA的基礎(chǔ)上去做進(jìn)一步探索。在市場(chǎng)上需求的牽引下,技術(shù)供應(yīng)商們?cè)缤矶紩?huì)邁出智能體這一步。

今年大模型開始流行之后,隨著RPA廠商們紛紛引入生成式AI,目前主流廠商都已發(fā)展到第三階段數(shù)字助手,少部分廠商則已經(jīng)開啟了第四階段對(duì)AI智能體的探索。

據(jù)王吉偉頻道了解,國內(nèi)已有數(shù)家RPA廠商著手這方面的研究,應(yīng)該很快也能推出相應(yīng)產(chǎn)品。

Gartner表示,到2025年,90%的RPA供應(yīng)商,將提供生成式AI輔助的自動(dòng)化服務(wù)。同時(shí)在生成式AI加持影響下,RPA市場(chǎng)將繼續(xù)保持高速增長。

從IPA的發(fā)展趨勢(shì)而言,今后每一家RPA廠商及超自動(dòng)化廠商都有可能進(jìn)化為RPA\超自動(dòng)化智能體。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。