文 | 吳懟懟 斯維奇
編輯 | 吳懟懟
在常見的招聘軟件上搜索帶貨主播職位,會(huì)發(fā)現(xiàn)一部分薪資已經(jīng)悄無聲息地落回了四位數(shù)。
直播間依舊火熱,動(dòng)輒百億銷售額、上億人次觀看量的情勢并沒有發(fā)生變化,但主播的薪資卻回落了。一個(gè)24小時(shí)不休息,面容姣好,口條順,業(yè)務(wù)精,工資還遠(yuǎn)低于真人主播的勞動(dòng)力逐漸成為一些小商家的心頭好。
水溫的變化,在22年8月就已經(jīng)開始。
這期間,樂華娛樂的CEO杜華制作了自己的數(shù)字人分身“華華子”在抖音直播帶貨,演員任泉也發(fā)布了自己的數(shù)字人視頻與抖音的觀眾分享,淘寶、抖音、視頻號也崛起了一批質(zhì)量參差不齊的帶貨主播與個(gè)人IP賬號。
數(shù)字人的技術(shù)逐漸成熟并普及,首先在電商領(lǐng)域造成沖擊,二流帶貨主播,一夜失業(yè)。
當(dāng)AIGC風(fēng)潮進(jìn)一步助推直播市場熱潮,互聯(lián)網(wǎng)巨頭也相繼推出數(shù)字人服務(wù),中小商家選擇數(shù)字人主播以降低成本,似乎風(fēng)景一變。但在魚龍混雜的時(shí)代里,一切現(xiàn)象都仍需觀察。
01 “每一家直播帶貨都需要一個(gè)數(shù)字人”
不僅是各大短視頻平臺(tái)和電商平臺(tái),在微信視頻號,在政務(wù)大廳,都有數(shù)字人的存在。
直播前期投入大,風(fēng)險(xiǎn)高,一些有帶貨需求的小商家就會(huì)轉(zhuǎn)向虛擬數(shù)字人。
對于小商家而言,考慮虛擬數(shù)字人的原因首先是優(yōu)秀的主播數(shù)量少,穩(wěn)定性欠缺。
在直播火熱的時(shí)候,一個(gè)形象氣質(zhì)俱佳、專業(yè)能力過硬的主播常常被挖來挖去,既拉高了行業(yè)的薪資預(yù)期,也讓直播的穩(wěn)定性受到影響。
其次,實(shí)地直播成本高,曝光效率低。小商家知名度低、商單少,就更加需要通過更長的直播時(shí)間增加曝光,有時(shí)需要做到24小時(shí)全天直播。
然而整個(gè)運(yùn)營團(tuán)隊(duì)跟著主播三班倒,全天候運(yùn)營難度大不說,直播場地、攝影燈光設(shè)備、場控、直播助理、后端、客服、化妝師也樣樣要錢,而且也并不保證時(shí)時(shí)刻刻都有人看。閑時(shí)流量轉(zhuǎn)化率低,但卻食之無味棄之可惜。
選擇虛擬數(shù)字人,商家們算的是一筆經(jīng)濟(jì)賬。
對于希望快速提高個(gè)人IP知名度的個(gè)人,多平臺(tái)、注冊多個(gè)賬號、高頻率更新視頻是一大實(shí)現(xiàn)途徑。
但傳統(tǒng)短視頻的制作過程常常耗費(fèi)大量時(shí)間和精力。從準(zhǔn)備素材、起草文案,到規(guī)劃分鏡并添加視覺與音效元素,再到反復(fù)調(diào)整直至達(dá)到最佳效果,一個(gè)簡單視頻的制作往往需要耗費(fèi)良久,如若要保證每日更新,拍攝素材量也需要跟上。即使拍攝團(tuán)隊(duì)都就位,本人也可能瑣事纏身,分身乏術(shù)。
虛擬數(shù)字人也提供了連軸轉(zhuǎn)之外的選擇。一旦根據(jù)本人的視頻克隆出自己的數(shù)字人分身,生成數(shù)字人的視頻幾乎就是點(diǎn)點(diǎn)鼠標(biāo)的事情。通過書寫簡短的文字或語音內(nèi)容,即可驅(qū)動(dòng)數(shù)字人進(jìn)行口頭表達(dá)。
一些視頻號、抖音博主利用數(shù)字人打造個(gè)人IP矩陣,能夠?qū)崿F(xiàn)短時(shí)間的大量曝光,更有甚者有“一夜爆紅”的案例。
于政府、銀行、網(wǎng)絡(luò)運(yùn)營商,數(shù)字人也有發(fā)揮作用的空間。消費(fèi)和出行復(fù)蘇后,文旅部門于旅行公司一起宣傳景區(qū),介紹當(dāng)?shù)靥厣率匙⌒?,快速輸出短視頻內(nèi)容,數(shù)字人也能助力政府部門降本增效。
一些明星也選擇制作屬于自己的數(shù)字人分身,盡管不一定有借此進(jìn)一步的曝光需要,更沒有帶貨需求,但踩在時(shí)代浪花之上總會(huì)給人建立一種高瞻遠(yuǎn)矚的印象。
02 入局者眾,水平參差
在中國,AI數(shù)字人公司如雨后春筍般涌現(xiàn),互聯(lián)網(wǎng)巨頭也紛紛涉足其中。市場上出現(xiàn)了眾多數(shù)字人服務(wù),騰訊云、阿里、京東、百度、科大訊飛、微軟都相繼推出AI電商產(chǎn)品,智能化助力商家自播。商湯、硅基智能、風(fēng)平智能、閃剪、奇妙元、元分身等中小型公司更是數(shù)不勝數(shù)。
面向C端用戶的Heygen為個(gè)人用戶提供了數(shù)字人制作的機(jī)會(huì),按分鐘計(jì)費(fèi),也降低了入場門檻。功能強(qiáng)大,擁有數(shù)百種成熟完善的公模,搭配幾十種世界語言,可以通過商品鏈接自動(dòng)生成帶貨視頻,完成度極高幾乎不需要任何改動(dòng),簡直是為跨境電商而生。
一方面是高歌猛進(jìn)的集體繁榮,當(dāng)我們比對半年來的數(shù)字人變化,會(huì)訝異技術(shù)的日新月異。另一方面是服務(wù)的良莠不齊和消費(fèi)者們并不完全買單的不虞之事。
首先是在不同的應(yīng)用場景中,數(shù)字人表現(xiàn)有別。
體驗(yàn)型產(chǎn)品無法通過數(shù)字人來展示,如服裝類和珠寶類直播需要主播真人親自穿戴,版型是否合身,材質(zhì)是否親膚,都需要通過實(shí)際展示,這也是直播的題中之義。而母嬰類和科技類的商品則需要更專業(yè)的呈現(xiàn)方式來提高可信度,建立和消費(fèi)者的信任關(guān)系,數(shù)字人尚且還不能做到。
其次是“似真非真”的尷尬。
盡管在直播過程中,數(shù)字人可以點(diǎn)對點(diǎn)歡迎、感謝活躍用戶、感謝刷禮物用戶,甚至普遍性地能根據(jù)預(yù)設(shè)關(guān)鍵詞自動(dòng)回復(fù),在短時(shí)間內(nèi)難辨真假,但與真人相比,它們的交互性仍顯不足。
人們甚至?xí)杏X這種“像真人卻不真實(shí)”的效果,產(chǎn)生所謂的「恐怖谷效應(yīng)」。
「恐怖谷效應(yīng)」是指在制作仿真人類外貌和行為的機(jī)器人或數(shù)字人時(shí),人類會(huì)在其逼真程度達(dá)到一定階段時(shí)感到反感或恐懼,而不是產(chǎn)生親近感。這個(gè)概念最早由日本機(jī)器人學(xué)家與作家森俊男于1970年代提出,用以描述當(dāng)機(jī)器人越來越像人類時(shí),人類的情感反應(yīng)出現(xiàn)突然的下降,然后隨著機(jī)器人更加逼真而再次上升。
當(dāng)虛擬數(shù)字人的外貌和行為越來越接近真人,但仍然有一些微小差異,這種差異會(huì)讓人感到反感或不自在,因?yàn)樗鼈兘咏鎸?shí)但又不完全相同。有時(shí)直播間的觀眾看了半個(gè)小時(shí),突然發(fā)現(xiàn)原來主播并不是真人,會(huì)有人產(chǎn)生不適的感覺。
迭代快,技術(shù)復(fù)雜,資源消耗大,發(fā)展不平衡,信息不透明,都直接或間接地導(dǎo)致這個(gè)行業(yè)魚龍混雜。有的數(shù)字人真假莫辨,有的只是“可動(dòng)照片”,動(dòng)動(dòng)口型,表情非常不自然。
數(shù)字人的制作涉及到多個(gè)技術(shù)領(lǐng)域,包括計(jì)算機(jī)圖形學(xué)、人工智能、機(jī)器學(xué)習(xí)等。不同技術(shù)的復(fù)雜度和成熟度不同,可能導(dǎo)致一些團(tuán)隊(duì)在某些方面取得突出成果,而在其他方面表現(xiàn)較差。
此外,數(shù)字人的質(zhì)量和逼真程度通常依賴于大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源。一些大型科技公司可能有更多的資源用于數(shù)據(jù)采集、模型訓(xùn)練和優(yōu)化,從而能夠創(chuàng)造更高水平的數(shù)字人。相比之下,小型公司或團(tuán)隊(duì)可能受限于資源,也會(huì)導(dǎo)致數(shù)字人的質(zhì)量較低。
03 懸在我們頭頂?shù)倪_(dá)摩克利斯之劍
即使在魚龍混雜的市場中選擇了適合而滿意的服務(wù),在數(shù)字人的發(fā)展道路上,依然有一個(gè)繞不開的問題,即虛擬數(shù)字人的版權(quán)歸屬。
數(shù)字人的生成通常依賴于真人提供的圖像、聲音和動(dòng)作數(shù)據(jù)。一旦數(shù)字人生成后,可能會(huì)引發(fā)有關(guān)版權(quán)和知識產(chǎn)權(quán)的爭議。誰擁有生成數(shù)字人所需的原始數(shù)據(jù)的權(quán)利?誰有權(quán)決定數(shù)字人的使用和分發(fā)?這些問題可能引發(fā)法律糾紛和知識產(chǎn)權(quán)爭議。
更早以前的虛擬人,以超現(xiàn)實(shí)或2D的形象存在,如在抖音上爆火的虛擬美妝達(dá)人柳夜熙,或者是依賴中之人配音的Vtuber絆愛,他們和現(xiàn)實(shí)世界的人的聯(lián)系其實(shí)并沒有那么緊密。
數(shù)字人是基于真人視頻、動(dòng)作捕捉、語音識別等技術(shù)生成的,必然建立在真人模型之上。即使存在由多個(gè)人面部特征組合的合成人,并不直接與任何另一個(gè)現(xiàn)實(shí)中存在的人相同,也依然需要這個(gè)基礎(chǔ)。然而,一旦數(shù)字人生成后,它們與原始人的聯(lián)系逐漸淡化,可以脫離原始人的行動(dòng),數(shù)字人能根據(jù)輸入的文案自動(dòng)生成視頻。
商家購買的實(shí)際上是一次克隆自己的機(jī)會(huì),在提供自己數(shù)分鐘的口述視頻后,基于視頻中的動(dòng)作、發(fā)音、表情,捕捉特征并生成一個(gè)高度近似本人的數(shù)字分身。
方便起見,一些小商家會(huì)選擇自己的臉作為數(shù)字人的形象,即使是員工,也可能是持有公司股權(quán)的員工。如果實(shí)在其貌不揚(yáng),也能夠選擇將美顏功能拉滿,依然還算看得過去。即使為形象業(yè)務(wù)俱佳的主播制作了數(shù)字人分身,離職后要么不允許商家繼續(xù)使用,要么還是長期支付使用費(fèi)用。
而前面提到的合成人形象雖然不存在版權(quán)問題,但在一些平臺(tái),“公模”可以用于制作短視頻,但用于直播會(huì)被封號。所謂“公?!?,就是數(shù)字人企業(yè)制作的合成人形象,一般會(huì)同時(shí)送給多個(gè)客戶共同使用。
由于數(shù)字人可以根據(jù)預(yù)設(shè)的文案自動(dòng)生成內(nèi)容,它們有可能被用來傳播虛假信息、造謠傳謠或進(jìn)行欺騙。數(shù)字人的逼真外表和語音可能讓人難以分辨真?zhèn)?。雖然商家都或多或少以營利為目的使用數(shù)字人,在平臺(tái)的監(jiān)管下不必自掘墳?zāi)?,但是一個(gè)頂著真人外表卻無法直接追溯到具體的人的發(fā)言始終存在這樣的風(fēng)險(xiǎn)。
今年五月初,抖音發(fā)布了關(guān)于人工智能生成內(nèi)容的平臺(tái)規(guī)范和行業(yè)倡議,倡議提到虛擬人背后的真人使用者,必須進(jìn)行實(shí)名注冊和認(rèn)證。其直播時(shí),必須由真人驅(qū)動(dòng)進(jìn)行實(shí)時(shí)互動(dòng),不允許完全由人工智能驅(qū)動(dòng)進(jìn)行互動(dòng)。此外,發(fā)布者應(yīng)對人工智能生成內(nèi)容進(jìn)行顯著標(biāo)識,幫助其他用戶區(qū)分虛擬與現(xiàn)實(shí),特別是易混淆場景。
AI數(shù)字人的繁榮不禁讓人想到《黑鏡》第六季第一集「Joan is Awful」,故事講述一位平凡的女子Joan意外發(fā)現(xiàn)自己的人生被翻拍成影集,在流媒體平臺(tái)上上演,由好萊塢大牌明星Salma Hayek挑大梁主演。Joan的生活與劇集幾乎同步進(jìn)行,日?,嵤?、晦暗的人生秘密都在屏幕上任人欣賞,而需要數(shù)月的時(shí)間拍攝的高質(zhì)量劇集通過AI數(shù)字人形象生成,能夠在極短的時(shí)間內(nèi)送到觀眾面前。
當(dāng)Joan的生活被公開,她丟了工作和未婚夫,咨詢律師無果,決定采取極端措施宣泄自己的情緒。她去舉辦婚禮的教堂現(xiàn)場大便,至少能夠摧毀劇中演員的生活。如此不雅的行為讓主演Salma Hayek找上門,但即使是演員本人也沒有話語權(quán),內(nèi)容生產(chǎn)公司簽訂的協(xié)議使之完全自由使用她的數(shù)字虛擬形象生成內(nèi)容。演員無權(quán)停播這個(gè)節(jié)目,也無法控制自己的數(shù)字人形象在劇中的行為,因此兩人協(xié)商去砸毀量子計(jì)算機(jī),為這個(gè)故事畫上句號。
劇中Streamberry公司創(chuàng)造的量子計(jì)算機(jī),它能根據(jù)現(xiàn)實(shí)影像資料生成虛擬世界影像,并且完成整個(gè)虛擬世界節(jié)目的拍攝、包裝、剪輯。公司借助數(shù)字人形象完全讓電腦生成內(nèi)容,這種方式能夠降低傳統(tǒng)劇集拍攝成本,顯著提高內(nèi)容生產(chǎn)效率。劇中這臺(tái)計(jì)算機(jī)確實(shí)被砸壞了,但與之相近的運(yùn)作方式卻正在我們身邊發(fā)生。
一個(gè)真假難辨的數(shù)字形象,使用權(quán)卻不完全掌握在自己手中,一旦其行動(dòng)脫離自己掌控,后果將不堪設(shè)想,身份認(rèn)同、行為掌控、個(gè)人隱私、倫理和道德考量乃至于技術(shù)與人性的沖突,種種問題都會(huì)逐一浮現(xiàn)。
AI數(shù)字人產(chǎn)業(yè)繁榮的同時(shí),我們也須時(shí)刻銘記懸在我們頭頂?shù)倪_(dá)摩克利斯之劍。