文 | 硅兔賽跑 王王
編輯|蔓蔓周
Sam Altman又出手了。這次他投資了一個只有5個人的RPA早期團(tuán)隊Induced AI,兩位聯(lián)合創(chuàng)始人Aryan Sharma和Ayush Pathak,一個18歲,一個19歲。
不只是Sam Altman,SignalFire、Peak XV 、SV Angel等機(jī)構(gòu)共同參與了Induced AI這一輪230萬美金的種子輪融資。此次融資,科技加速器AI Grant的兩位創(chuàng)始人Nat Friedman和Daniel Gross也加入了Induced AI的團(tuán)隊。這兩位在科技界的大名如雷貫耳,Nat曾任Github的CEO,Daniel創(chuàng)立的搜索引擎公司Cue則被蘋果收購。
這支團(tuán)隊及其產(chǎn)品有何過人之處,為何能夠吸引眾多大佬的橄欖枝呢?
RPA 3.0:打開瀏覽器,讓AI完成所有工作
Induced AI的兩位創(chuàng)始人——Aryan和Ayush——別看年齡小,創(chuàng)業(yè)經(jīng)歷卻相當(dāng)豐富。這兩位年輕程序員的創(chuàng)業(yè)履歷遍及醫(yī)療、廣告、教育、區(qū)塊鏈、web3等領(lǐng)域,甚至還發(fā)起過創(chuàng)業(yè)社群和類似孵化器的組織。此次創(chuàng)立的Induced AI則是一款釋放企業(yè)員工生產(chǎn)力的“RPA 3.0”。用戶只需用簡單的英語輸入工作流程和錄屏視頻,Induced AI就能將其實時轉(zhuǎn)換為偽代碼,并調(diào)取多種相關(guān)工具,來執(zhí)行大量重復(fù)性任務(wù)。
兩位創(chuàng)始人|圖源:Linkedln
RPA(Robotic Process Automation,機(jī)器人流程自動化)并非新鮮概念,普通人在日常生活中也隨處可見,例如Excel中的“宏”,或者很多人用來搶演唱會門票的小工具“按鍵精靈”,都可以看做RPA的前身。傳統(tǒng)的RPA定義上,軟件記錄人的操作,比如點擊鼠標(biāo)、鍵盤輸入、打開文件夾、發(fā)送郵件等,并將這些操作固定下來形成規(guī)則和套路,批量地自動執(zhí)行,從而節(jié)省人的時間,提升工作效率。隨著AI技術(shù)進(jìn)步,機(jī)器識別圖像、理解語言、邏輯思考的能力不斷提升,這些技術(shù)也與RPA結(jié)合到一起,釋放更大的能量。
正如RPA概念所定義的,迄今為止,市面上的RPA工具需要人工制定好明確的規(guī)則,而復(fù)雜任務(wù)的規(guī)則也會耗費大量人力。Induced AI則借助大語言模型的能力,讓工具有了邏輯推理和判斷的能力。用戶只需要說出他的需求,比如“給我建個Jira的ticket”,或者“幫我篩選一波簡歷,給候選人發(fā)面試邀請”,Induced AI就可以對要做哪些事情進(jìn)行實時判斷和拆解,并自動調(diào)取相關(guān)的工具來完成整個流程。
以篩選簡歷這個任務(wù)為例,常規(guī)的人工操作流程包括:登錄你的領(lǐng)英賬號、搜索簡歷、評估簡歷、下載簡歷、發(fā)送邀請等。如果領(lǐng)英沒有提供官方的API接口,過去的RPA很可能就卡在登錄這一步了,甚至可能被判定為惡意機(jī)器人。Induced AI在Chromium上構(gòu)建了一個瀏覽器環(huán)境,它有自己的內(nèi)存、文件系統(tǒng)和身份驗證憑據(jù)(電子郵件、電話號碼)來執(zhí)行復(fù)雜的流程,因此可以自動完成登錄、填寫驗證碼、文件下載、存儲和重復(fù)使用數(shù)據(jù)等動作,沒有開放API的軟件也攔不住Induced AI。
一波AI Agent正在襲來
讓工具,特別是有智能的工具替人類干活,是從我們的老祖宗開始就產(chǎn)生的夢想。從木牛流馬到Siri,人們始終覺得這些“助手”還欠點兒火候。直到ChatGPT和AutoGPT橫空出世,AI Agent似乎即將成為可能。
OpenAI的研究員Lilian Weng撰文定義了基于大語言模型的AI Agent:大語言模型、記憶、任務(wù)規(guī)劃、使用工具,四個模塊缺一不可。盡管Induced AI團(tuán)隊將自己定位成“RPA 3.0”,但從其產(chǎn)品特性上來看,他們更像一個AI Agent,這也是為什么Sam Altman等AI大佬一致看好這個年輕的團(tuán)隊。
當(dāng)前的AI熱潮下,Induced AI不是第一個、也絕不是最后一個AI Agent團(tuán)隊。
暫且不提那些訂票、點外賣的小而美Agent,或者AutoGPT、HuggingGPT等幾乎人盡皆知的項目,與Induced AI有同樣打造AI員工野心的團(tuán)隊就有不少。
例如今年三月完成3.5億美元B輪融資的Adept,自己訓(xùn)練了一個ACT-1,這個模型專門用來在計算機(jī)上響應(yīng)用戶的自然語言指令并執(zhí)行操作。它可以使用現(xiàn)有的所有軟件工具、API和網(wǎng)站。ACT-1同樣基于瀏覽器工作,用戶可以在和AI的聊天框里輸入自己的命令,例如在Salesforce里創(chuàng)建一條銷售線索,或者在GoogleSheet里計算一些數(shù)據(jù)。
Adept的ACT-1|圖源:Brigade Web
無獨有偶,科技公司Rabbit也研發(fā)了自己的大模型LAM(Large Action Model),并基于它推出了一套完整的“個人操作系統(tǒng)Rabbit OS”解決方案。LAM能夠觀察人機(jī)交互的界面,形成“概念藍(lán)圖”,從而在用戶的自然語言指令不那么明確的時候理解并實現(xiàn)人類的潛在意圖?;贚AM,Rabbit還專門設(shè)計了一套軟件平臺,使其Agent能夠更人性化地完成任務(wù)。今年10月,Rabbit獲得Khosla Ventures領(lǐng)投、老股東跟投的2000萬美元融資。
未來已來嗎?
當(dāng)然,除了創(chuàng)業(yè)團(tuán)隊,傳統(tǒng)的RPA、低代碼、無代碼等公司,幾乎無一不在擁抱大語言模型和AI Agent,畢竟在今天,只要一提這兩個概念就能讓投資人和客戶眼前一亮,忍不住多看一眼。
今年以來,AI Agent的幾個爆款應(yīng)用和幾次出圈,讓人工智能的呼聲一次次被推向高潮。可我們?nèi)匀徊唤獑?,未來已來嗎?眼前的熱鬧是變革還是泡沫?
如果拿自動駕駛來做個比喻,我們更為熟悉的Copilot和Midjourney這樣的產(chǎn)品類似L3級別的自動駕駛,即機(jī)器是人類的“助手”和“副駕”,而Agent對應(yīng)著L4級別的自動駕駛,人類只需設(shè)定目標(biāo)、監(jiān)督結(jié)果,機(jī)器自己完成決策和執(zhí)行。今天,L3級別的AI副駕仍然處于落地應(yīng)用的早期,無論是技術(shù)能力還是商業(yè)價值,尚有大量值得探討的問題,未能全面推廣。
以此看來,L4級別的AI Agent大規(guī)模應(yīng)用可能就更遙遠(yuǎn)了。那么,當(dāng)前的AI熱又是一波割韭菜的炒作嗎?它是否會想幾年前的區(qū)塊鏈、VR、元宇宙一樣,只是曇花一現(xiàn)?
Adept的ACT-1|圖源:DEV
可以肯定的是,生成式AI以及相關(guān)的概念熱度正在消退。可以看硅兔君之前的文章:《Jasper AI 一年內(nèi)估值打8折,AIGC開始降溫》。
無論是媒體關(guān)注還是市場反應(yīng)都已經(jīng)暗暗證實了這一點。Gartner今年發(fā)布的技術(shù)成熟度曲線上,生成式AI和AI增強(qiáng)的軟件工程都放在了膨脹期,意味著這兩項技術(shù)在未來2-5年都即將進(jìn)入幻滅期低谷——一如曾經(jīng)的自動駕駛和上述技術(shù)概念。不過,正是在熱度衰減、噪聲安靜的幻滅期,才有更多有意義的經(jīng)驗和知識沉淀下來,為接下來的啟蒙期奠定基礎(chǔ)。
在變革性技術(shù)的發(fā)展歷程中,每一次波峰波谷都有意義。
從圖靈機(jī)到IBM的超級計算機(jī)深藍(lán),從機(jī)器學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò),從AlphaGo到ChatGPT,每一個里程碑之間都充滿失望、懷疑和寒冬,將視線拉長,人類走到今天已經(jīng)取得了長足的進(jìn)步。無論是否有泡沫,未來永遠(yuǎn)是樂觀者和實干者創(chuàng)造的。
參考資料:
Sam Altman backs teens’ AI startup automating browser-native workflows(TechCrunch)
https://www.rabbit.tech/
https://www.adept.ai/