文 | 硅兔賽跑 王王
編輯|蔓蔓周
Sam Altman又出手了。這次他投資了一個(gè)只有5個(gè)人的RPA早期團(tuán)隊(duì)Induced AI,兩位聯(lián)合創(chuàng)始人Aryan Sharma和Ayush Pathak,一個(gè)18歲,一個(gè)19歲。
不只是Sam Altman,SignalFire、Peak XV 、SV Angel等機(jī)構(gòu)共同參與了Induced AI這一輪230萬(wàn)美金的種子輪融資。此次融資,科技加速器AI Grant的兩位創(chuàng)始人Nat Friedman和Daniel Gross也加入了Induced AI的團(tuán)隊(duì)。這兩位在科技界的大名如雷貫耳,Nat曾任Github的CEO,Daniel創(chuàng)立的搜索引擎公司Cue則被蘋(píng)果收購(gòu)。
這支團(tuán)隊(duì)及其產(chǎn)品有何過(guò)人之處,為何能夠吸引眾多大佬的橄欖枝呢?
RPA 3.0:打開(kāi)瀏覽器,讓AI完成所有工作
Induced AI的兩位創(chuàng)始人——Aryan和Ayush——?jiǎng)e看年齡小,創(chuàng)業(yè)經(jīng)歷卻相當(dāng)豐富。這兩位年輕程序員的創(chuàng)業(yè)履歷遍及醫(yī)療、廣告、教育、區(qū)塊鏈、web3等領(lǐng)域,甚至還發(fā)起過(guò)創(chuàng)業(yè)社群和類(lèi)似孵化器的組織。此次創(chuàng)立的Induced AI則是一款釋放企業(yè)員工生產(chǎn)力的“RPA 3.0”。用戶(hù)只需用簡(jiǎn)單的英語(yǔ)輸入工作流程和錄屏視頻,Induced AI就能將其實(shí)時(shí)轉(zhuǎn)換為偽代碼,并調(diào)取多種相關(guān)工具,來(lái)執(zhí)行大量重復(fù)性任務(wù)。
兩位創(chuàng)始人|圖源:Linkedln
RPA(Robotic Process Automation,機(jī)器人流程自動(dòng)化)并非新鮮概念,普通人在日常生活中也隨處可見(jiàn),例如Excel中的“宏”,或者很多人用來(lái)?yè)屟莩獣?huì)門(mén)票的小工具“按鍵精靈”,都可以看做RPA的前身。傳統(tǒng)的RPA定義上,軟件記錄人的操作,比如點(diǎn)擊鼠標(biāo)、鍵盤(pán)輸入、打開(kāi)文件夾、發(fā)送郵件等,并將這些操作固定下來(lái)形成規(guī)則和套路,批量地自動(dòng)執(zhí)行,從而節(jié)省人的時(shí)間,提升工作效率。隨著AI技術(shù)進(jìn)步,機(jī)器識(shí)別圖像、理解語(yǔ)言、邏輯思考的能力不斷提升,這些技術(shù)也與RPA結(jié)合到一起,釋放更大的能量。
正如RPA概念所定義的,迄今為止,市面上的RPA工具需要人工制定好明確的規(guī)則,而復(fù)雜任務(wù)的規(guī)則也會(huì)耗費(fèi)大量人力。Induced AI則借助大語(yǔ)言模型的能力,讓工具有了邏輯推理和判斷的能力。用戶(hù)只需要說(shuō)出他的需求,比如“給我建個(gè)Jira的ticket”,或者“幫我篩選一波簡(jiǎn)歷,給候選人發(fā)面試邀請(qǐng)”,Induced AI就可以對(duì)要做哪些事情進(jìn)行實(shí)時(shí)判斷和拆解,并自動(dòng)調(diào)取相關(guān)的工具來(lái)完成整個(gè)流程。
以篩選簡(jiǎn)歷這個(gè)任務(wù)為例,常規(guī)的人工操作流程包括:登錄你的領(lǐng)英賬號(hào)、搜索簡(jiǎn)歷、評(píng)估簡(jiǎn)歷、下載簡(jiǎn)歷、發(fā)送邀請(qǐng)等。如果領(lǐng)英沒(méi)有提供官方的API接口,過(guò)去的RPA很可能就卡在登錄這一步了,甚至可能被判定為惡意機(jī)器人。Induced AI在Chromium上構(gòu)建了一個(gè)瀏覽器環(huán)境,它有自己的內(nèi)存、文件系統(tǒng)和身份驗(yàn)證憑據(jù)(電子郵件、電話號(hào)碼)來(lái)執(zhí)行復(fù)雜的流程,因此可以自動(dòng)完成登錄、填寫(xiě)驗(yàn)證碼、文件下載、存儲(chǔ)和重復(fù)使用數(shù)據(jù)等動(dòng)作,沒(méi)有開(kāi)放API的軟件也攔不住Induced AI。
一波AI Agent正在襲來(lái)
讓工具,特別是有智能的工具替人類(lèi)干活,是從我們的老祖宗開(kāi)始就產(chǎn)生的夢(mèng)想。從木牛流馬到Siri,人們始終覺(jué)得這些“助手”還欠點(diǎn)兒火候。直到ChatGPT和AutoGPT橫空出世,AI Agent似乎即將成為可能。
OpenAI的研究員Lilian Weng撰文定義了基于大語(yǔ)言模型的AI Agent:大語(yǔ)言模型、記憶、任務(wù)規(guī)劃、使用工具,四個(gè)模塊缺一不可。盡管Induced AI團(tuán)隊(duì)將自己定位成“RPA 3.0”,但從其產(chǎn)品特性上來(lái)看,他們更像一個(gè)AI Agent,這也是為什么Sam Altman等AI大佬一致看好這個(gè)年輕的團(tuán)隊(duì)。
當(dāng)前的AI熱潮下,Induced AI不是第一個(gè)、也絕不是最后一個(gè)AI Agent團(tuán)隊(duì)。
暫且不提那些訂票、點(diǎn)外賣(mài)的小而美Agent,或者AutoGPT、HuggingGPT等幾乎人盡皆知的項(xiàng)目,與Induced AI有同樣打造AI員工野心的團(tuán)隊(duì)就有不少。
例如今年三月完成3.5億美元B輪融資的Adept,自己訓(xùn)練了一個(gè)ACT-1,這個(gè)模型專(zhuān)門(mén)用來(lái)在計(jì)算機(jī)上響應(yīng)用戶(hù)的自然語(yǔ)言指令并執(zhí)行操作。它可以使用現(xiàn)有的所有軟件工具、API和網(wǎng)站。ACT-1同樣基于瀏覽器工作,用戶(hù)可以在和AI的聊天框里輸入自己的命令,例如在Salesforce里創(chuàng)建一條銷(xiāo)售線索,或者在GoogleSheet里計(jì)算一些數(shù)據(jù)。
Adept的ACT-1|圖源:Brigade Web
無(wú)獨(dú)有偶,科技公司Rabbit也研發(fā)了自己的大模型LAM(Large Action Model),并基于它推出了一套完整的“個(gè)人操作系統(tǒng)Rabbit OS”解決方案。LAM能夠觀察人機(jī)交互的界面,形成“概念藍(lán)圖”,從而在用戶(hù)的自然語(yǔ)言指令不那么明確的時(shí)候理解并實(shí)現(xiàn)人類(lèi)的潛在意圖?;贚AM,Rabbit還專(zhuān)門(mén)設(shè)計(jì)了一套軟件平臺(tái),使其Agent能夠更人性化地完成任務(wù)。今年10月,Rabbit獲得Khosla Ventures領(lǐng)投、老股東跟投的2000萬(wàn)美元融資。
未來(lái)已來(lái)嗎?
當(dāng)然,除了創(chuàng)業(yè)團(tuán)隊(duì),傳統(tǒng)的RPA、低代碼、無(wú)代碼等公司,幾乎無(wú)一不在擁抱大語(yǔ)言模型和AI Agent,畢竟在今天,只要一提這兩個(gè)概念就能讓投資人和客戶(hù)眼前一亮,忍不住多看一眼。
今年以來(lái),AI Agent的幾個(gè)爆款應(yīng)用和幾次出圈,讓人工智能的呼聲一次次被推向高潮??晌覀?nèi)匀徊唤獑?wèn),未來(lái)已來(lái)嗎?眼前的熱鬧是變革還是泡沫?
如果拿自動(dòng)駕駛來(lái)做個(gè)比喻,我們更為熟悉的Copilot和Midjourney這樣的產(chǎn)品類(lèi)似L3級(jí)別的自動(dòng)駕駛,即機(jī)器是人類(lèi)的“助手”和“副駕”,而Agent對(duì)應(yīng)著L4級(jí)別的自動(dòng)駕駛,人類(lèi)只需設(shè)定目標(biāo)、監(jiān)督結(jié)果,機(jī)器自己完成決策和執(zhí)行。今天,L3級(jí)別的AI副駕仍然處于落地應(yīng)用的早期,無(wú)論是技術(shù)能力還是商業(yè)價(jià)值,尚有大量值得探討的問(wèn)題,未能全面推廣。
以此看來(lái),L4級(jí)別的AI Agent大規(guī)模應(yīng)用可能就更遙遠(yuǎn)了。那么,當(dāng)前的AI熱又是一波割韭菜的炒作嗎?它是否會(huì)想幾年前的區(qū)塊鏈、VR、元宇宙一樣,只是曇花一現(xiàn)?
Adept的ACT-1|圖源:DEV
可以肯定的是,生成式AI以及相關(guān)的概念熱度正在消退。可以看硅兔君之前的文章:《Jasper AI 一年內(nèi)估值打8折,AIGC開(kāi)始降溫》。
無(wú)論是媒體關(guān)注還是市場(chǎng)反應(yīng)都已經(jīng)暗暗證實(shí)了這一點(diǎn)。Gartner今年發(fā)布的技術(shù)成熟度曲線上,生成式AI和AI增強(qiáng)的軟件工程都放在了膨脹期,意味著這兩項(xiàng)技術(shù)在未來(lái)2-5年都即將進(jìn)入幻滅期低谷——一如曾經(jīng)的自動(dòng)駕駛和上述技術(shù)概念。不過(guò),正是在熱度衰減、噪聲安靜的幻滅期,才有更多有意義的經(jīng)驗(yàn)和知識(shí)沉淀下來(lái),為接下來(lái)的啟蒙期奠定基礎(chǔ)。
在變革性技術(shù)的發(fā)展歷程中,每一次波峰波谷都有意義。
從圖靈機(jī)到IBM的超級(jí)計(jì)算機(jī)深藍(lán),從機(jī)器學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò),從AlphaGo到ChatGPT,每一個(gè)里程碑之間都充滿失望、懷疑和寒冬,將視線拉長(zhǎng),人類(lèi)走到今天已經(jīng)取得了長(zhǎng)足的進(jìn)步。無(wú)論是否有泡沫,未來(lái)永遠(yuǎn)是樂(lè)觀者和實(shí)干者創(chuàng)造的。
參考資料:
Sam Altman backs teens’ AI startup automating browser-native workflows(TechCrunch)
https://www.rabbit.tech/
https://www.adept.ai/