文 | 硅兔賽跑 椎名
編輯 | 王子
幾乎每個人的智能手機都配備了語音AI助手。
你可能和ta定過鬧鐘、查過資料、甚至玩成語接龍或者斗過嘴?,F(xiàn)在,想象一下,如果你的Siri此刻擁有了一個人類形象,ta會是什么樣子?你會更加親近ta嗎?
這正是一眾數(shù)字人創(chuàng)企正在嘗試的事情。近日,一向?qū)C器人硬件有所偏好的軟銀,相中了一家特別的數(shù)字人創(chuàng)企,領投了該公司的7000萬美元融資。有了這筆資金,公司的總投資已達1.35億美元,其中,李嘉誠旗下維港投資的身影出現(xiàn)在3次投資之中。
這家公司的名字就野心十足——Soul Machines,有一絲要在機器上復刻人類靈魂的意味。更早之前A輪融資,這家公司便獲得來自李嘉誠旗下的維港投資(Horizons Ventures)和Iconiq Capital共750萬美元資金注入。
Soul Machines正在向世界輸出一批數(shù)字人,并希望這些有情感的虛擬AI們,能夠進一步融入人類的真實世界。
未來幾年,從銀行到商店客服,從手機到汽車,從視頻網(wǎng)站到社交平臺,這群新的物種很可能變得無處不在。
那么,接下來,Soul Machines會是全世界最成功的數(shù)字人供應商嗎?
圖丨Soul Machines官網(wǎng)展示的數(shù)字人
1、拿過奧斯卡獎的創(chuàng)始人
首先,打造一個數(shù)字人和培養(yǎng)一名人類難度自然是不可同日而語,但可不要小瞧一個數(shù)字人的誕生。
按照大的技術方向拆解的話,一個基礎的數(shù)字人將包括動作捕捉、渲染建模、AI能力的注入等前沿技術。目前世面上的數(shù)字人供應商們,也可以按照上述3個不同側(cè)重方向進行簡單分類。
其中,動作捕捉和渲染建模主要決定了一個數(shù)字人的形象,而AI能力則負責塑造數(shù)字人與人類交互時的反應。
Soul Machines的創(chuàng)始人——Mark Sagar——則是少有的兼具這些方面從業(yè)背景的人。
Mark Sagar 是電影《阿凡達》《金剛》《蜘蛛俠2》背后的靈魂人物。憑借他和他的團隊在這些電影中的虛擬人物技術,他曾于2010年和2011年獲得奧斯卡頒發(fā)的科技獎。
更早之前,在于奧克蘭大學生物工程學院動畫技術實驗室任主任期間,他就開始進行能夠自主互動的動畫系統(tǒng)的開發(fā),以助力下一代人機互動和面部動作技術的發(fā)展。
以自家女兒為原型,Mark Sagar帶領動畫技術實驗室研發(fā)出一個“永生”于屏幕中的數(shù)字寶寶—— Baby X,這個寶寶擁有一個數(shù)字大腦,可以感知、學習、進步和交流,基于生物仿真原理,它的形象是一個18月左右的嬰兒樣貌,其面部表情會隨著思想、認知、情緒的變化而改變,且可以傾聽并對語言給出表情和動作上的反饋。雖然現(xiàn)在我們已經(jīng)對這樣的虛擬形象不陌生,但是在2016年,開發(fā)出這樣一個具有情感響應功能、有著個性和特色的虛擬人,實屬新鮮。
圖 | Baby X (來源:Fanatical Futurist YouTube)
2016年,一個特別的機會降臨到Mark Sagar身上。李嘉誠基金會成員參觀奧克蘭大學時,Mark Sagar和他的Baby X項目被安排到了行程之中。那次展示相當成功,之后為Mark Sagar的公司Soul Machine帶來了維港投資的資金:同年12月,維港投資宣布,和Iconiq Capital牽頭Soul Machines的750萬美元A輪融資。
不過,Soul Machines為他們的客戶提供的產(chǎn)品,卻不是再是這個“數(shù)字小嬰兒”,而是更成熟的數(shù)字人。
Mark Sagar和他的團隊看到了數(shù)字人在增強公司品牌體驗上的潛力。面向企業(yè)提供定制化的數(shù)字人是Soul Machines成立之后的重心。
他們想要解決這樣一個基本問題:大部分公司與C端用戶的最主要的互動,依賴應用程序和網(wǎng)站進行,那么,企業(yè)如何在日益數(shù)字化的世界中塑造個人品牌體驗?
對于這一問題,Soul Machines認為答案是數(shù)字化勞動力——數(shù)字人。
理想情況下,數(shù)字人在一天中的任何時候使用任何語言提供服務,并能很好地模仿人類體驗,使人類產(chǎn)生情感反應,最終提高品牌忠誠度。當C端用戶與Soul Machines提供的數(shù)字人互動時,還可以收集C端用戶面部表情和情緒反應方式信息,匿名化后用于訓練數(shù)字人背后的數(shù)字大腦,以便它持續(xù)解釋并改進反應。
這就像與虛擬銷售員交談。
舉個例子,作為體驗的一部分,你可以在電子商務平臺購買護膚品,并有機會與智能護膚顧問交談。特別是在疫情期間,我們發(fā)現(xiàn)一個關鍵問題是,越來越多的購物行為和體驗品牌的方式是在數(shù)字世界中完成的。
“傳統(tǒng)上,數(shù)字世界具有某種業(yè)務主導性,甚至聊天機器人也具有很強的針對性,你輸入一個問題,就會得到對應的回應。促使我們思考的是,應該如何想象人類與未來所有數(shù)字世界的互動?”公司聯(lián)合創(chuàng)始人兼首席商務官Greg Cross曾如此表示。
2、Soul Machines的數(shù)字人方法論
目前,不少重視線上購物體驗的國際品牌已經(jīng)開始和Soul Machines進行這種嘗試。
比如雀巢。Soul Machines為它打造了“Ruth”,一個由AI驅(qū)動的烘焙老師,可以回答關于烘焙的基本問題,并根據(jù)客戶廚房里的材料幫助他們找到適用的食譜。除了雀巢以外,梅賽德斯奔馳、SKI-II和索尼也都和Soul Machines定制了它們的數(shù)字人。
圖丨Soul Machines的企業(yè)用戶分布行業(yè)
值得一提的是,Soul Machines還與世界衛(wèi)生組織合作,創(chuàng)建了Florence,一個虛擬衛(wèi)生工作者,可以全天候為那些試圖戒煙或了解新冠疫情的人提供咨詢服務。
Florence的存在,也預示著數(shù)字人在遠程醫(yī)療領域的潛在應用能力,比如,對于更喜歡現(xiàn)場視頻體驗的患者,數(shù)字人可以幫助提供一定程度的隱私和舒適性,讓患者以一種舒服的方式提出敏感問題,從而使醫(yī)生能夠處理更多醫(yī)療情況。
軟銀投資顧問公司投資總監(jiān)Anna Lo表示,Soul Machines的數(shù)字人解決方案在服務行業(yè)尤其受到青睞。這些行業(yè)中的企業(yè)希望增強在線客戶服務體驗,而不僅僅是基于文本的聊天或純音頻電話,“借助自主動畫,Soul Machines的定制數(shù)字人是一個有用的客戶獲取工具?!?/p>
數(shù)據(jù)顯示,使用了Soul Machines的數(shù)字人之后,有客戶的C端用戶的轉(zhuǎn)化率平均提高了4.6倍,用戶滿意度提高了2.3%。在Soul Machines與SK-II的合作中,客戶在與數(shù)字人“Yumi”互動后,購買的可能性提高了兩倍。
這種直接收益之外Greg Cross則指出數(shù)字人對于企業(yè)的另一個好處還在于,對于消費者來說,許多數(shù)字助理可能感覺更像是一個噱頭而不是一個有用的工具,但這些助手允許公司收集客戶的第一方數(shù)據(jù)。這些數(shù)據(jù)可用于獲取和留住客戶并增加更多價值,而不是花巨資從社交媒體平臺或谷歌廣告聯(lián)盟那里購買這些數(shù)據(jù)。
目前,這家公司的團隊成員由 AI 研究人員、神經(jīng)科學家、心理學家、藝術家共同組成,既提供我們上文提到的面向企業(yè)的定制化數(shù)字人業(yè)務,也提供標準化數(shù)字服務,用戶可以從Digital DNA Studio中選擇標準化的數(shù)字人(長相、聲音、12+語言、性格、會話能力等等)應用到網(wǎng)站上,并監(jiān)測數(shù)字人的流量。
當然,Soul Machines設想用數(shù)字人改善品牌線上體驗的種種,這些事情成立的一個大前提是,數(shù)字人本身能夠提供好的使用體驗。
事實上,正如語音助手市場早期常給人留下“人工智障”的笑料一樣,眼下初出茅廬的數(shù)字人產(chǎn)業(yè),其實也有著很大的改善空間,核心在于更快地持續(xù)提升人機交互體驗。
為了能夠衡量數(shù)字人產(chǎn)品的進展,Soul Machines撰寫了一份白皮書,提出了一個由五個級別組成的數(shù)字人進化框架:
0級,即“無自主權(quán)“,只是一個錄制的動畫,就像一部卡通片。
第1級和第2級,涉及了更多理解人類反應并作出更真實表現(xiàn)的動畫。此處可以想象一下,《阿凡達》或《指環(huán)王》等電影中,動畫人物如何模仿真實演員的動作。(比如實時形象生成上,數(shù)字人的口型或表情略為僵硬等還是業(yè)內(nèi)尚未解決的大問題)
第3級至第5級,則屬于實時的、動態(tài)生成的、具有內(nèi)容感知力的數(shù)字人。
Soul Machines認為自己目前處于第3級,即"認知訓練的動畫(CTA)系統(tǒng),該系統(tǒng)使用算法來生成一組動畫,而不需要明確的作者。作者被專注于定義內(nèi)容和角色范圍的AI訓練師。系統(tǒng)會告知訓練師需要改進的領域。
Cross介紹,Soul Machines正在努力實現(xiàn)第4級自主性,或“基于目標的形象”。該系統(tǒng)在訓練師的指導下嘗試新的交互,并從每個交互中學習。這方面的一個近似的應用例子是虛擬AI助手,但擁有實時形象的虛擬AI助手更接近Soul Machines的設定。
最近,Soul Machines就宣布了一個更大膽的計劃,他們打算建立一個名人虛擬孿生名錄。
去年開始,該公司與洛杉磯湖人隊的籃球運動員卡梅羅·安東尼合作,創(chuàng)造了他的數(shù)字人形象。更早之前,說唱歌手Will.I.am也和Soul Machines進行了類似的合作。
沒錯,Soul Machines還設想了一個人類可以自由創(chuàng)建自己的數(shù)字人的世界。“我們非常有可能在未來的某個時間創(chuàng)造出自己的數(shù)字孿生體,并且能夠通過與他們在線互動來訓練這些孿生體,”Cross說。
不知道作為讀者的你有沒有心動,想要馬上嘗試打造虛擬世界中的另一個“你”。至少,作者本人已經(jīng)開始幻想,我的數(shù)字人化身能代替我上班碼字。