文|觀察未來科技
今天,越來越多的虛擬人正我們的日常生活中落地應(yīng)用??梢哉f,隨著數(shù)字技術(shù)和智能技術(shù)的進步,虛擬人是必然到來的一個未來趨勢。
中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《2020年虛擬數(shù)字人發(fā)展白皮書》中對虛擬人有明確的釋義:虛擬人是指具有數(shù)字化外形的虛擬人物,依賴顯示設(shè)備存在,并且擁有人的相貌、人的舉止以及人的思想。
簡單來說,虛擬人就是“數(shù)字人+人格”。值得一提的是,雖然當前,各行各業(yè)的虛擬人層出不窮,但大多數(shù)虛擬人,依然只是利用信息技術(shù)實現(xiàn)的人形外觀的數(shù)字人形象,并不具有人格,我們離最終形態(tài)的虛擬人也仍有距離。
那么,怎么樣賦予虛擬人人格呢?或者說,虛擬人的最終形態(tài),究竟是什么?
沒有人格的虛擬人
目前的虛擬人,其實大致可分為兩類:2D虛擬人物和3D虛擬人。
其中,2D虛擬人是根據(jù)真實圖像建模的,與真人非常相似。服裝、發(fā)型等外觀不支持自由修改,形象相對固定。2D虛擬人不能在3D場景中使用,不能在3D中呈現(xiàn),也不能在VR,AR和游戲中使用。
3D虛擬人則具有多種風格,可以自由地創(chuàng)建風格化的外觀。它具有廣泛的應(yīng)用場景。主要應(yīng)用場景包括內(nèi)容創(chuàng)建、IP創(chuàng)建和創(chuàng)意內(nèi)容創(chuàng)建。它具有多交互、多形式、自由修改的特點。它可以與真實場景匹配,以進一步增強逼真的效果。
從技術(shù)角度來看,2D虛擬人一般采用靜態(tài)掃描技術(shù)制作,即使用40-60臺攝像機拍攝真人全方位的照片,并根據(jù)照片的光線和角度進行矩陣掃描,從而在軟件中呈現(xiàn)出2D立體圖像。靜態(tài)掃描技術(shù)只需要拍照和少量所需數(shù)據(jù),即可低成本創(chuàng)建2D虛擬人體圖像。而今天,我們看到的越來越多走進了直播間24小時直播不休息的的虛擬數(shù)字人,其實更多的是2D虛擬人。
當然,相較于2D虛擬人,3D虛擬人體建模對軟件和技術(shù)有更高的要求,采用動態(tài)掃描技術(shù),通過人臉特征識別、空間變換分量、模型重建分量、骨變形分量等方式,采集光影效果或照片數(shù)據(jù),紋理融合組件等合成多模態(tài)3D模型,除了真實圖像外,還包括卡通,二維等類型。
值得一提的是,今天,盡管隨著技術(shù)的進步,虛擬數(shù)字人的成本也有所下降,特別是2D視頻類虛擬人,但對于3D虛擬人來說,技術(shù)的有限和成本的高企依然是許多企業(yè)面臨的問題。
來自中科院深圳先進技術(shù)研究院智能設(shè)計與機器視覺研究室的信息顯示,制作、訓練虛擬人的技術(shù)還不夠成熟,尤其是3D成像設(shè)備、后期制作開發(fā)等成本居高不下,建模效率相對較低。同時,虛擬人的算法性能有待進一步提升,特別是實時面部表情捕捉與還原的精準度亟待提高。另外,當前人機交互相關(guān)技術(shù)也還未成熟,虛擬人更多承擔輔助角色,無法獨立參與實際意義上的工作。
當前,制作3D虛擬人的價格,便宜的有幾萬元,貴一些的需要上百萬元,更精細且并發(fā)要求高的,花費上千萬元的也有。根據(jù)藍色光標《元宇宙營銷工作手冊》,僅設(shè)計一個虛擬人形象就要花費10-100萬元,后續(xù)的內(nèi)容制作和智能驅(qū)動研發(fā)還需持續(xù)投入。
價格高昂的同時,虛擬人產(chǎn)能也不足。當前制作虛擬人,大部分仍采用3D建模+動作捕捉,這種傳統(tǒng)的方式,雖然可以生產(chǎn)出電影畫質(zhì)的虛擬人,精致細膩,但成本依然很高,無法生產(chǎn)更多虛擬人。
可以說,當前的3D虛擬人的開發(fā),更多的還是人們對新技術(shù)、新業(yè)態(tài)的一種好奇、驗證和嘗試。更重要的是,目前,不管是2D虛擬人,還是3D虛擬人,都還不是最終形態(tài)的超級自然虛擬人,不僅與我們的真實生活隔著一個次元的距離,也并不具備真實的人格。
不可持續(xù)的中之人
顯然,想要讓虛擬人擁有人格并不是一件容易的事。
在通用人工智能出來之前,“中之人”似乎是目前最好的虛擬人技術(shù)方案。所謂中之人,就是在虛擬外表背后的真實扮演者,他們的動作會被捕捉并映射在虛擬人上。虛擬外觀加現(xiàn)實的人格,這才使人們造出了真正的虛擬人。但問題是,由中之人扮演的虛擬人,并不具備可持續(xù)性。
2022年,由字節(jié)跳動、樂華娛樂傾情打造的國內(nèi)虛擬偶像女團A-SOUL也忽然宣布,旗下成員“珈樂”進入“直播休眠”,終止日常直播和絕大部分偶像活。
看起來,A-Soul是突然宣布的“休眠”,但實際上,解散的暗流早已涌動。在A-Soul宣布解散之前,A-SOUL成員,國內(nèi)人氣最高的虛擬主播嘉然在B站直播了自己的生日會,在這場不到3小時的直播里,她總共收到了粉絲259萬的打賞,創(chuàng)造了國內(nèi)虛擬主播單場直播收入的新紀錄。然而,這259萬的收入,嘉然的中之人卻只能拿到零星一點。
根據(jù)知乎網(wǎng)友驚蟄的爆料:“粉絲每次送她們的打賞。50%給了B站,49%給了幕后團隊,竟然還有1%,能給到她們本人”,“不是總額的1%,是去掉B站部分后,剩下部分的1%。實際是粉絲支出額的千分之6”。換言之,B站粉絲續(xù)費一個138元的艦長,中之人可以拿到的僅有6毛錢。
此外,在“休眠”公告發(fā)出后,大量關(guān)于中之人珈樂的私密網(wǎng)易云、B站和豆瓣賬號的截圖在粉絲之間開始傳播。在B站和豆瓣,“珈樂”轉(zhuǎn)發(fā)著珈樂的切片和二創(chuàng),一定程度上參與到對A-SOUL的討論中;而在網(wǎng)易云平臺,她不斷地宣泄自己的負面情緒,包括“在訓練中傷到了胸椎”、“動捕服劃傷了大腿”等等身體上的傷病,以及“被領(lǐng)導辱罵”、“在凌晨被叫醒”等工作中的問題。這些動態(tài)勾勒出了一個與人們認知完全不同的“珈樂”和她極度糟糕的精神狀態(tài)。
最直接的薪資問題之下,當然還有運營過程中的種種亂象。比如官方強迫成員間營業(yè),逼迫成員續(xù)約,續(xù)約了就要面臨更加嚴苛的工作環(huán)境,訓練出一身傷病,甚至還有職場霸凌等林林總總的問題。
所有的爆料都指向同一個答案:這些看似生活在光環(huán)里的虛擬偶像,背后的中之人的處境,甚至不如一個普通的打工人。
無獨有偶,著名的日本虛擬偶像“絆愛”,因為擁有四個不同的中之人而遭到粉絲的極力反對,導致如今宣布“無限期休眠”。
虛擬男團動畫導演強項曾經(jīng)做過一個通過中之人實現(xiàn)的虛擬主播項目。在主播生日當天,公司收到了許多由粉絲送出的真的鮮花、口紅、化妝品等真人才能用的東西。即便他們的偶像是虛擬主播,但他們其實很清楚自己喜歡的是虛擬外表下的中之人。這個事情也讓強項在重新反思自己的產(chǎn)品邏輯之后,中止了項目。
可以看到,中之人技術(shù)的確在一些情境下滿足了用戶對陪伴的需求,但它并沒有真正解決虛擬人的核心問題,即如何賦予虛擬人獨立的人格和情感。今天,虛擬人的外表雖然是一個吸引人的因素,但卻不是虛擬人的核心屬性。
“皮”和“魂”之間的平衡是關(guān)鍵。虛擬人的外表可以起到吸引用戶的作用,但真正讓用戶留下來并建立情感聯(lián)系的是虛擬人的內(nèi)在特質(zhì),包括對話能力、情感理解、人格塑造等。甚至從功能性和情感上來看,虛擬人的“魂”比“皮”更加重要。正如電影《她》一樣,一個真正擁有靈魂的AI,即便只有聲音沒有外殼,同樣可以為用戶帶來心靈上的安慰。
虛擬人的最終形態(tài)
那么,怎么樣賦予虛擬人人格呢?或者說,虛擬人的最終形態(tài),究竟是什么?
從本質(zhì)來看,虛擬人依然是一項“仿人”的技術(shù),那么,想要虛擬人真正帶來像人一樣的體驗,其實只有兩個方法——把人帶到虛擬空間去,或者把虛擬人帶到現(xiàn)實空間來。前者對應(yīng)的其實還是元宇宙的市場,而后者對應(yīng)的則是機器人或全息投影等技術(shù)。這才是虛擬人產(chǎn)品的最終形態(tài)。
那么,怎么把人帶到虛擬空間去?其實原理很簡單,就是我們在數(shù)字世界打造的一個真正的數(shù)字孿生人。當然,數(shù)字孿生人不僅僅是通過計算機、深度學習、類腦科學、數(shù)字孿生等等合成的一個具有人類特征的虛擬形象,更重要的是具備更高級的智能和自主互動能力。
也就是說,數(shù)字孿生人將會成為我們在元宇宙的虛擬角色,并且是不受空間與時間限制的可以在這個虛擬環(huán)境中活動,數(shù)字虛擬人甚至可以脫離我們的物理軀體的壽命限制,可以在虛擬世界中實現(xiàn)永生。而實現(xiàn)數(shù)字孿生人的背后,需要的是則軟件版的大腦、基于軟件而改變的自我、精神意義上的雙胞胎的技術(shù)支持。
美國艾倫研究所的科學家早在2003年就開始著手建構(gòu)人腦以及非人靈長類大腦的基因表現(xiàn)圖譜聯(lián)結(jié)圖譜。2010年起,美國國家衛(wèi)生院以及數(shù)所大學也聯(lián)合展開了“人類大腦聯(lián)結(jié)計劃”,共有一千兩百位健康受試者(包括數(shù)百對雙胞胎以及他們的非雙胞胎手足)接受了大腦造影、基因定序以及行為檢測。
德國與加拿大的科學家也在合作進行“巨腦計劃”,目前,他們已經(jīng)建立了一個來自六十五歲女性的三維大腦模型,其高達二十微米的分辨率,讓單一細胞都幾乎無所遁形。另外,自適應(yīng)可塑伸縮電子神經(jīng)擬態(tài)系統(tǒng)(SyNAPSE)計劃則希望利用神經(jīng)突觸模擬芯片來建立一個數(shù)位大腦。
2014年,IBM成功發(fā)表了仿人腦芯片。該芯片擁有一百萬個“神經(jīng)元”以及2.56億個“突觸”,可以短暫模擬大腦活動。同年,日本的“京”超級計算機(K Computer)使用八萬三千個處理器,也成功模擬了人類一秒鐘腦部活動的百分之一。2013年,歐盟也展開了“人腦計劃”。這項十年計劃擁有十三億美元的資金,旨在通過尖端的計算機工具來繪制一張精細的人類腦部活動地圖,并希望利用這些信息來建造一臺能夠模擬人腦網(wǎng)絡(luò)結(jié)構(gòu)的超級計算機。
或許在未來,當擁有意識克隆的生物學原型軀體死亡時,雖然克隆的意識也會想念它的軀體,但它并不會感覺到軀體已經(jīng)離世,這就像截肢的患者也會想念自己被截肢的部位一樣,但是假若有合適的假肢,他們?nèi)匀荒軌蚝芎玫剡m應(yīng)生活。當越來越多的人通過意識克隆在虛擬世界打造出具有意識的虛擬人時,人類也在延續(xù)自身——即便是以意識克隆的形式。
虛擬人的另一種終極形態(tài),則是由AI驅(qū)動,再由全息投影投射到我們的現(xiàn)實世界,與我們真實的交互。這需要AI具有復(fù)雜的自我學習和情感理解能力,能夠準確理解人類語言的含義、情感和背后的意圖。再通過全息投影技術(shù),高度智能化的虛擬人就可以以高度逼真的形象呈現(xiàn)在我們周圍的空間中。這將為交互增添更多層次的現(xiàn)實感,讓人們能夠在真實世界中與虛擬人進行面對面的對話、合作和探討。虛擬人不再僅僅是一個數(shù)字化的存在,而是在我們的視野和現(xiàn)實環(huán)境中實實在在地存在著。
當然,虛擬人的人格和最終形態(tài)是一個復(fù)雜且有待探索的領(lǐng)域,但隨著技術(shù)的進步和社會的變化,可以預(yù)見的是,在不遠的未來,虛擬人將會在元宇宙中成為人類的數(shù)字伙伴,或者在物理世界中與我們共同生活。