文 | 硅兔賽跑 椎名
編輯 | 王子
幾乎每個(gè)人的智能手機(jī)都配備了語(yǔ)音AI助手。
你可能和ta定過(guò)鬧鐘、查過(guò)資料、甚至玩成語(yǔ)接龍或者斗過(guò)嘴?,F(xiàn)在,想象一下,如果你的Siri此刻擁有了一個(gè)人類形象,ta會(huì)是什么樣子?你會(huì)更加親近ta嗎?
這正是一眾數(shù)字人創(chuàng)企正在嘗試的事情。近日,一向?qū)C(jī)器人硬件有所偏好的軟銀,相中了一家特別的數(shù)字人創(chuàng)企,領(lǐng)投了該公司的7000萬(wàn)美元融資。有了這筆資金,公司的總投資已達(dá)1.35億美元,其中,李嘉誠(chéng)旗下維港投資的身影出現(xiàn)在3次投資之中。
這家公司的名字就野心十足——Soul Machines,有一絲要在機(jī)器上復(fù)刻人類靈魂的意味。更早之前A輪融資,這家公司便獲得來(lái)自李嘉誠(chéng)旗下的維港投資(Horizons Ventures)和Iconiq Capital共750萬(wàn)美元資金注入。
Soul Machines正在向世界輸出一批數(shù)字人,并希望這些有情感的虛擬AI們,能夠進(jìn)一步融入人類的真實(shí)世界。
未來(lái)幾年,從銀行到商店客服,從手機(jī)到汽車,從視頻網(wǎng)站到社交平臺(tái),這群新的物種很可能變得無(wú)處不在。
那么,接下來(lái),Soul Machines會(huì)是全世界最成功的數(shù)字人供應(yīng)商嗎?
圖丨Soul Machines官網(wǎng)展示的數(shù)字人
1、拿過(guò)奧斯卡獎(jiǎng)的創(chuàng)始人
首先,打造一個(gè)數(shù)字人和培養(yǎng)一名人類難度自然是不可同日而語(yǔ),但可不要小瞧一個(gè)數(shù)字人的誕生。
按照大的技術(shù)方向拆解的話,一個(gè)基礎(chǔ)的數(shù)字人將包括動(dòng)作捕捉、渲染建模、AI能力的注入等前沿技術(shù)。目前世面上的數(shù)字人供應(yīng)商們,也可以按照上述3個(gè)不同側(cè)重方向進(jìn)行簡(jiǎn)單分類。
其中,動(dòng)作捕捉和渲染建模主要決定了一個(gè)數(shù)字人的形象,而AI能力則負(fù)責(zé)塑造數(shù)字人與人類交互時(shí)的反應(yīng)。
Soul Machines的創(chuàng)始人——Mark Sagar——?jiǎng)t是少有的兼具這些方面從業(yè)背景的人。
Mark Sagar 是電影《阿凡達(dá)》《金剛》《蜘蛛俠2》背后的靈魂人物。憑借他和他的團(tuán)隊(duì)在這些電影中的虛擬人物技術(shù),他曾于2010年和2011年獲得奧斯卡頒發(fā)的科技獎(jiǎng)。
更早之前,在于奧克蘭大學(xué)生物工程學(xué)院動(dòng)畫技術(shù)實(shí)驗(yàn)室任主任期間,他就開始進(jìn)行能夠自主互動(dòng)的動(dòng)畫系統(tǒng)的開發(fā),以助力下一代人機(jī)互動(dòng)和面部動(dòng)作技術(shù)的發(fā)展。
以自家女兒為原型,Mark Sagar帶領(lǐng)動(dòng)畫技術(shù)實(shí)驗(yàn)室研發(fā)出一個(gè)“永生”于屏幕中的數(shù)字寶寶—— Baby X,這個(gè)寶寶擁有一個(gè)數(shù)字大腦,可以感知、學(xué)習(xí)、進(jìn)步和交流,基于生物仿真原理,它的形象是一個(gè)18月左右的嬰兒樣貌,其面部表情會(huì)隨著思想、認(rèn)知、情緒的變化而改變,且可以傾聽并對(duì)語(yǔ)言給出表情和動(dòng)作上的反饋。雖然現(xiàn)在我們已經(jīng)對(duì)這樣的虛擬形象不陌生,但是在2016年,開發(fā)出這樣一個(gè)具有情感響應(yīng)功能、有著個(gè)性和特色的虛擬人,實(shí)屬新鮮。
圖 | Baby X (來(lái)源:Fanatical Futurist YouTube)
2016年,一個(gè)特別的機(jī)會(huì)降臨到Mark Sagar身上。李嘉誠(chéng)基金會(huì)成員參觀奧克蘭大學(xué)時(shí),Mark Sagar和他的Baby X項(xiàng)目被安排到了行程之中。那次展示相當(dāng)成功,之后為Mark Sagar的公司Soul Machine帶來(lái)了維港投資的資金:同年12月,維港投資宣布,和Iconiq Capital牽頭Soul Machines的750萬(wàn)美元A輪融資。
不過(guò),Soul Machines為他們的客戶提供的產(chǎn)品,卻不是再是這個(gè)“數(shù)字小嬰兒”,而是更成熟的數(shù)字人。
Mark Sagar和他的團(tuán)隊(duì)看到了數(shù)字人在增強(qiáng)公司品牌體驗(yàn)上的潛力。面向企業(yè)提供定制化的數(shù)字人是Soul Machines成立之后的重心。
他們想要解決這樣一個(gè)基本問(wèn)題:大部分公司與C端用戶的最主要的互動(dòng),依賴應(yīng)用程序和網(wǎng)站進(jìn)行,那么,企業(yè)如何在日益數(shù)字化的世界中塑造個(gè)人品牌體驗(yàn)?
對(duì)于這一問(wèn)題,Soul Machines認(rèn)為答案是數(shù)字化勞動(dòng)力——數(shù)字人。
理想情況下,數(shù)字人在一天中的任何時(shí)候使用任何語(yǔ)言提供服務(wù),并能很好地模仿人類體驗(yàn),使人類產(chǎn)生情感反應(yīng),最終提高品牌忠誠(chéng)度。當(dāng)C端用戶與Soul Machines提供的數(shù)字人互動(dòng)時(shí),還可以收集C端用戶面部表情和情緒反應(yīng)方式信息,匿名化后用于訓(xùn)練數(shù)字人背后的數(shù)字大腦,以便它持續(xù)解釋并改進(jìn)反應(yīng)。
這就像與虛擬銷售員交談。
舉個(gè)例子,作為體驗(yàn)的一部分,你可以在電子商務(wù)平臺(tái)購(gòu)買護(hù)膚品,并有機(jī)會(huì)與智能護(hù)膚顧問(wèn)交談。特別是在疫情期間,我們發(fā)現(xiàn)一個(gè)關(guān)鍵問(wèn)題是,越來(lái)越多的購(gòu)物行為和體驗(yàn)品牌的方式是在數(shù)字世界中完成的。
“傳統(tǒng)上,數(shù)字世界具有某種業(yè)務(wù)主導(dǎo)性,甚至聊天機(jī)器人也具有很強(qiáng)的針對(duì)性,你輸入一個(gè)問(wèn)題,就會(huì)得到對(duì)應(yīng)的回應(yīng)。促使我們思考的是,應(yīng)該如何想象人類與未來(lái)所有數(shù)字世界的互動(dòng)?”公司聯(lián)合創(chuàng)始人兼首席商務(wù)官Greg Cross曾如此表示。
2、Soul Machines的數(shù)字人方法論
目前,不少重視線上購(gòu)物體驗(yàn)的國(guó)際品牌已經(jīng)開始和Soul Machines進(jìn)行這種嘗試。
比如雀巢。Soul Machines為它打造了“Ruth”,一個(gè)由AI驅(qū)動(dòng)的烘焙老師,可以回答關(guān)于烘焙的基本問(wèn)題,并根據(jù)客戶廚房里的材料幫助他們找到適用的食譜。除了雀巢以外,梅賽德斯奔馳、SKI-II和索尼也都和Soul Machines定制了它們的數(shù)字人。
圖丨Soul Machines的企業(yè)用戶分布行業(yè)
值得一提的是,Soul Machines還與世界衛(wèi)生組織合作,創(chuàng)建了Florence,一個(gè)虛擬衛(wèi)生工作者,可以全天候?yàn)槟切┰噲D戒煙或了解新冠疫情的人提供咨詢服務(wù)。
Florence的存在,也預(yù)示著數(shù)字人在遠(yuǎn)程醫(yī)療領(lǐng)域的潛在應(yīng)用能力,比如,對(duì)于更喜歡現(xiàn)場(chǎng)視頻體驗(yàn)的患者,數(shù)字人可以幫助提供一定程度的隱私和舒適性,讓患者以一種舒服的方式提出敏感問(wèn)題,從而使醫(yī)生能夠處理更多醫(yī)療情況。
軟銀投資顧問(wèn)公司投資總監(jiān)Anna Lo表示,Soul Machines的數(shù)字人解決方案在服務(wù)行業(yè)尤其受到青睞。這些行業(yè)中的企業(yè)希望增強(qiáng)在線客戶服務(wù)體驗(yàn),而不僅僅是基于文本的聊天或純音頻電話,“借助自主動(dòng)畫,Soul Machines的定制數(shù)字人是一個(gè)有用的客戶獲取工具?!?/p>
數(shù)據(jù)顯示,使用了Soul Machines的數(shù)字人之后,有客戶的C端用戶的轉(zhuǎn)化率平均提高了4.6倍,用戶滿意度提高了2.3%。在Soul Machines與SK-II的合作中,客戶在與數(shù)字人“Yumi”互動(dòng)后,購(gòu)買的可能性提高了兩倍。
這種直接收益之外Greg Cross則指出數(shù)字人對(duì)于企業(yè)的另一個(gè)好處還在于,對(duì)于消費(fèi)者來(lái)說(shuō),許多數(shù)字助理可能感覺更像是一個(gè)噱頭而不是一個(gè)有用的工具,但這些助手允許公司收集客戶的第一方數(shù)據(jù)。這些數(shù)據(jù)可用于獲取和留住客戶并增加更多價(jià)值,而不是花巨資從社交媒體平臺(tái)或谷歌廣告聯(lián)盟那里購(gòu)買這些數(shù)據(jù)。
目前,這家公司的團(tuán)隊(duì)成員由 AI 研究人員、神經(jīng)科學(xué)家、心理學(xué)家、藝術(shù)家共同組成,既提供我們上文提到的面向企業(yè)的定制化數(shù)字人業(yè)務(wù),也提供標(biāo)準(zhǔn)化數(shù)字服務(wù),用戶可以從Digital DNA Studio中選擇標(biāo)準(zhǔn)化的數(shù)字人(長(zhǎng)相、聲音、12+語(yǔ)言、性格、會(huì)話能力等等)應(yīng)用到網(wǎng)站上,并監(jiān)測(cè)數(shù)字人的流量。
當(dāng)然,Soul Machines設(shè)想用數(shù)字人改善品牌線上體驗(yàn)的種種,這些事情成立的一個(gè)大前提是,數(shù)字人本身能夠提供好的使用體驗(yàn)。
事實(shí)上,正如語(yǔ)音助手市場(chǎng)早期常給人留下“人工智障”的笑料一樣,眼下初出茅廬的數(shù)字人產(chǎn)業(yè),其實(shí)也有著很大的改善空間,核心在于更快地持續(xù)提升人機(jī)交互體驗(yàn)。
為了能夠衡量數(shù)字人產(chǎn)品的進(jìn)展,Soul Machines撰寫了一份白皮書,提出了一個(gè)由五個(gè)級(jí)別組成的數(shù)字人進(jìn)化框架:
0級(jí),即“無(wú)自主權(quán)“,只是一個(gè)錄制的動(dòng)畫,就像一部卡通片。
第1級(jí)和第2級(jí),涉及了更多理解人類反應(yīng)并作出更真實(shí)表現(xiàn)的動(dòng)畫。此處可以想象一下,《阿凡達(dá)》或《指環(huán)王》等電影中,動(dòng)畫人物如何模仿真實(shí)演員的動(dòng)作。(比如實(shí)時(shí)形象生成上,數(shù)字人的口型或表情略為僵硬等還是業(yè)內(nèi)尚未解決的大問(wèn)題)
第3級(jí)至第5級(jí),則屬于實(shí)時(shí)的、動(dòng)態(tài)生成的、具有內(nèi)容感知力的數(shù)字人。
Soul Machines認(rèn)為自己目前處于第3級(jí),即"認(rèn)知訓(xùn)練的動(dòng)畫(CTA)系統(tǒng),該系統(tǒng)使用算法來(lái)生成一組動(dòng)畫,而不需要明確的作者。作者被專注于定義內(nèi)容和角色范圍的AI訓(xùn)練師。系統(tǒng)會(huì)告知訓(xùn)練師需要改進(jìn)的領(lǐng)域。
Cross介紹,Soul Machines正在努力實(shí)現(xiàn)第4級(jí)自主性,或“基于目標(biāo)的形象”。該系統(tǒng)在訓(xùn)練師的指導(dǎo)下嘗試新的交互,并從每個(gè)交互中學(xué)習(xí)。這方面的一個(gè)近似的應(yīng)用例子是虛擬AI助手,但擁有實(shí)時(shí)形象的虛擬AI助手更接近Soul Machines的設(shè)定。
最近,Soul Machines就宣布了一個(gè)更大膽的計(jì)劃,他們打算建立一個(gè)名人虛擬孿生名錄。
去年開始,該公司與洛杉磯湖人隊(duì)的籃球運(yùn)動(dòng)員卡梅羅·安東尼合作,創(chuàng)造了他的數(shù)字人形象。更早之前,說(shuō)唱歌手Will.I.am也和Soul Machines進(jìn)行了類似的合作。
沒錯(cuò),Soul Machines還設(shè)想了一個(gè)人類可以自由創(chuàng)建自己的數(shù)字人的世界?!拔覀兎浅S锌赡茉谖磥?lái)的某個(gè)時(shí)間創(chuàng)造出自己的數(shù)字孿生體,并且能夠通過(guò)與他們?cè)诰€互動(dòng)來(lái)訓(xùn)練這些孿生體,”Cross說(shuō)。
不知道作為讀者的你有沒有心動(dòng),想要馬上嘗試打造虛擬世界中的另一個(gè)“你”。至少,作者本人已經(jīng)開始幻想,我的數(shù)字人化身能代替我上班碼字。