文|定焦 向園
編輯|方展博
午夜1點的直播間,一位女主播還在引導用戶購買團購券?!八笔峭趿Σ惋嫷甑闹鞑?,最長記錄持續(xù)賣貨13個小時,偶爾有路過的觀眾提問,“她”也沒有回應。
這位主播并非真人,是王力花兩千多元買來的數(shù)字人,使用權一年。
“成本比請博主探店低很多”,王力起初對這個新雇來的“員工”很滿意,現(xiàn)在卻信心全無。“數(shù)字人公司說可以一天24小時循環(huán)播,可實際情況是,賬號動不動就被平臺封禁,想售后也聯(lián)系不上銷售”。
王力覺得自己沒賺到錢、沒圈到流量,反而被割了韭菜。不止他一個人,大量商家稱自己用數(shù)字人直播被平臺判定為違規(guī)封號,很多人也和王力一樣售后無門。
去年底,借著AIGC的東風,潤米咨詢創(chuàng)始人劉潤等財經(jīng)大V自曝使用數(shù)字人分身以來,虛擬數(shù)字人急速升溫。
今年,國內(nèi)上演“百模大戰(zhàn)”,低沉本的數(shù)字人進入市場,百元級別的數(shù)字分身迅速被炒成一本萬利的財富經(jīng)。每到深夜,打開主流平臺(抖音、淘寶、快手、視頻號、京東、拼多多),有大量數(shù)字人堅守在直播間。
但這幾個月以來,關于數(shù)字人的質(zhì)疑聲漸起,諸如效果太假、市場混亂、價格不透明等,平臺也在加強監(jiān)管。5月9日,抖音發(fā)布《抖音關于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議(以下簡稱數(shù)字人行業(yè)倡議)》。截至目前,其他平臺暫未跟進。
抖音一紙規(guī)范在圈內(nèi)掀起了不小的討論。接近抖音的運營人士周一路告訴「定焦」,這代表抖音明確開放了人工智能生成的圖片、視頻,和衍生的虛擬人直播,也意味著數(shù)字人要被“管”了。
而抖音最先出手,是因為一方面,抖音上的數(shù)字人最盛行,內(nèi)容風險把控成本很大,另一方面,數(shù)字人直播對抖音的商業(yè)貢獻不大,舉個例子,抖音的興趣電商主打的是情緒和隨機性,數(shù)字人完全比不了真人。
大眾熟知的數(shù)字人,有IP向的,例如虛擬偶像洛天依、虛擬博主AYAYI,還有功能型的,如數(shù)字銀行的數(shù)字人客服。本文討論的是幫企業(yè)和主播賣貨、拍視頻的數(shù)字人。
不同公司對它可能有不同的叫法,包括數(shù)字人、虛擬人、虛擬數(shù)字人、數(shù)字分身甚至AI主播等,市面上大量數(shù)字人沒有接入AI大腦,本文統(tǒng)一稱為數(shù)字人。
數(shù)字人作為AIGC技術目前最容易應用和變現(xiàn)的領域,太多人蠢蠢欲動,企業(yè)想靠它降本、創(chuàng)收,主播想借它輔助創(chuàng)作、抓住流量。但很多人和王力有一樣的疑問:為什么賬號很容易被封?數(shù)字人市場為什么這么亂?這些平臺到底歡不歡迎數(shù)字人?
被封的數(shù)字人,易踩四大坑
“哥們,你被坑了,這是錄播。”王力把數(shù)字人直播的視頻發(fā)到幾個行業(yè)群里請教,有人這樣告訴他。
當數(shù)字人席卷各大直播間,“封禁潮”也在同時發(fā)生。結合多位受訪者的說法,錄播是目前數(shù)字人直播最容易踩的坑之一。
因為市面上錄播的數(shù)字人“橫行”,它成本更低、技術相對落后,只需要寫好腳本,錄入相應的軟件,讓“數(shù)字人”按照腳本生成視頻,直播時播放視頻就行。
“最早一批嘗試數(shù)字人直播技術的商家,很多是被錄播割了韭菜。”數(shù)字人代理公司負責人張現(xiàn)說,很多商家此前沒做過直播,不熟悉平臺規(guī)則,但對數(shù)字人很感興趣,花萬八千,從代理商那里買到一款錄好視頻的數(shù)字人,但很容易被封”。
其實不論是真人還是數(shù)字人,錄播在抖音和淘寶直播都是被嚴厲打擊的。直播平臺運營人士宋欣鑫稱,因為平臺要求直播時根據(jù)現(xiàn)場情況做出實時反應,但錄播做不到。
抖音的《數(shù)字人行業(yè)倡議》中提到,數(shù)字人直播必須由真人驅(qū)動進行實時互動,不允許完全由AI驅(qū)動進行互動。
51數(shù)字人創(chuàng)始人陳鴻告訴「定焦」,“如果直播內(nèi)容長時間重復,或是一套直播話術短時間內(nèi)重復使用,都有可能被判錄播封禁?!?/p>
“撞臉”,也有可能被平臺識別為錄播,被封號的概率也會增加。
“如果你刷到好幾個賬號,使用的是同樣的數(shù)字人,說明很有可能買的是同一個數(shù)字人模特?!敝芤宦氛f,這非常影響用戶體驗,因為理論上同一個人不可能同時出現(xiàn)在多個直播間、講著不同的內(nèi)容。
AI領域創(chuàng)業(yè)者高叢對定焦稱,制作足夠逼真、現(xiàn)象級的數(shù)字分身,例如劉潤,成本上百萬元,而大多數(shù)中小企業(yè)只用得起百元、千元價位的數(shù)字人,多數(shù)人選的是公模,很容易撞臉、撞聲音。
目前數(shù)字人的產(chǎn)品模式,分為公模(公用模特)、主播定制和源碼系統(tǒng),價格從百元到幾萬元不等,主要差別是形象、聲音的真實度。
定焦制圖
其中公模最便宜,市面上主流的數(shù)字人平臺,都提供一定數(shù)量的公模,單月費用幾十到幾百元。
想用自己形象出鏡的,一般會選擇主播定制模式。這個價格經(jīng)歷過跳水,從之前的幾十萬降到了現(xiàn)在的幾百元到幾千元不等。后期的視頻生成需另外按時長收費。
外界認為最貴的是第三種模式,即數(shù)字人系統(tǒng)源碼或是SaaS軟件,購買之后可以自主修改數(shù)字人,多家公司的報價都在五萬元左右。
沒有進行實名注冊和標識,也是一些數(shù)字人賬號被封的原因。抖音在《數(shù)字人行業(yè)倡議》中提到,需要虛擬人在平臺進行實名注冊,并標識虛擬人直播,以便公眾判斷等。
陳鴻告訴定焦,其中的注冊流程,對一些中小企業(yè)來說“不容易走通”。
不過,站在平臺的角度,數(shù)字人內(nèi)容的風險把控問題,的確日益嚴峻。人工智能生成的內(nèi)容本身就很難識別真假,有些數(shù)字人又高度逼真,如果被黑灰產(chǎn)鉆了空子難以追責。
網(wǎng)經(jīng)社電子商務研究中心特約研究員、上海漢盛律師事務所高級合伙人李旻律師曾對媒體指出,抖音發(fā)布這個規(guī)范的主要目的是規(guī)范平臺上的人工智能生成內(nèi)容,并防止其產(chǎn)生侵權等問題。同時,抖音通過發(fā)布規(guī)范,有利于在發(fā)生侵權案件后減少平臺責任。目前法律規(guī)定,如果平臺對平臺內(nèi)的侵權案件未采取必要措施的,對于擴大的損失需要與侵權人承擔連帶責任。
周一路稱,還有一些賬號的封禁原因是,內(nèi)容侵權、違規(guī),或存在虛構虛假宣傳和欺詐。
此外,數(shù)字人內(nèi)容質(zhì)量差,也會引起平臺的注意。
陳鴻總結了低質(zhì)數(shù)字人的三大表現(xiàn):口型對不上,或是音畫不同步;視頻質(zhì)量粗糙,用720分辨率的冒充1080高清的,摳像有綠邊,人物動作不自然,實際交付和廣告招商的案例貨不對板;交互差,主要表現(xiàn)是用錄播冒充直播,直播間問答反饋慢,無法實時互動,后臺用真人聲音驅(qū)動并沒有節(jié)省人力成本。
如果客戶遇到封號的情況,張現(xiàn)稱,會提醒客戶把產(chǎn)品下線、指導解封,“但如果無法解決問題,我們也沒有辦法”。他提醒,現(xiàn)在沒有公司能保證不會被封號。
數(shù)字人火了,也亂了
監(jiān)管加碼,說到底還是因為視頻和直播間里的數(shù)字人良莠不齊。效果好的數(shù)字人,讓人辨不出真假,甚至被當成牟利工具;效果差的,一看就是“假人”,影響用戶體驗。
結合多位受訪者的分析,因為這個產(chǎn)業(yè)發(fā)展不久,技術方離市場端較遠,容易導致產(chǎn)品和市場需求不匹配,而且數(shù)字人技術有“進場容易做深難”的特點。
陳鴻對「定焦」梳理了近期陸續(xù)出現(xiàn)的優(yōu)質(zhì)數(shù)字人案例,有劉潤數(shù)字人分身、萬達的數(shù)字人主播、換臉科技給明亞保險做的數(shù)字保險代理人等等,很多人感嘆,“原來數(shù)字人可以做得這么真實”。還有硅基智能、風平智能等近百家數(shù)字人企業(yè)的大量數(shù)字人案例共同推動了行業(yè)發(fā)展。
去年11月(左)VS今年6月(右),劉潤賬號發(fā)布的數(shù)字人分身視頻,圖源 / 抖音
最興奮的是兩撥人。一撥是原本想做短視頻、但受制于制作門檻,或精力有限、不具備表達能力的中小創(chuàng)業(yè)者。讓他們興奮的是,用幾百幾千元就可以擁有一個數(shù)字人分身。
輸出數(shù)字人產(chǎn)品的技術型公司也很興奮,但很多小公司銷售渠道不完善、缺乏客戶資源;大公司因為2D數(shù)字人客單價偏低、售后成本過高,不愿意投入過多服務人員。而這個全新的領域還沒有專門的代運營公司,因此,另一撥人,也就是手握大批有客戶資源的代理商高調(diào)入場了。
產(chǎn)品是數(shù)字人技術公司做的,代理商是客戶和產(chǎn)品方中間的角色。因為數(shù)字人市場潛力大,很多代理商公司提供一條龍服務,從兜售數(shù)字人產(chǎn)品,到線下數(shù)字人培訓,目標是拿下那些想做短視頻和電商的中小企業(yè)。這期間,很多代理商用數(shù)字人視頻銷售、講課,噱頭十足。
種種因素帶來的結果是,不只是數(shù)字人產(chǎn)品價格不透明,供給端也很難看清真實的市場需求,做出來的產(chǎn)品解決不了痛點。
根據(jù)陳鴻對市場的觀察,客戶對數(shù)字人產(chǎn)品的核心需求是,在預算基礎上,盡可能追求真實。但市面上很多數(shù)字人,“24小時循環(huán)講解,一口水都不喝,不笑,沒有氛圍、沒有互動,真實性和體驗感很差,用戶就算看到,大概率也會劃過去”。
很多人覺得數(shù)字人“太假”,還因為這個新興市場進場者太多,但技術受限,做出來的精品不多,用戶體驗不佳。
虛擬人技術種類 圖源 / 中商產(chǎn)業(yè)研究院
現(xiàn)在視頻和直播里的數(shù)字人多是2D真人,相比3D超寫實的柳葉熙、2D卡通的A-SOUL,制作成本更低、制作周期更短,但實際效果參差不齊。
播報型數(shù)字人因為講解話術統(tǒng)一,已滿足基本體驗,比較典型的是知識付費、健康知識領域;但直播間里的交互型數(shù)字人,還比較“假”。
“數(shù)字人直播主流交互的方式是,準備一個標準題庫,觸發(fā)關鍵詞后,直接從題庫里選取答案,讓數(shù)字人‘說’出來。”陳鴻介紹。
華盟新媒集團CEO、淘寶聯(lián)盟成都理事長黃博告訴定焦,即時互動是直播間交易轉(zhuǎn)化的關鍵,很多公司的宣傳重點是“數(shù)字人可以替代真人主播和用戶互動”,但真正具備AI自動對話、自動聊天功能的數(shù)字人很少。
「定焦」在多個使用數(shù)字人的頭部品牌直播間通過評論區(qū)提問,一類是不給出相應;另一類能給出“XX收到了你的提問,稍等回復哦”的話術,但要么是幾分鐘后給出答非所問的回復,要么是等待五分鐘后還沒有回復。
多位受訪者提到,解決不了交互性差的硬傷,數(shù)字人的市場空間就會受限。目前大量直播間是在黃金時間段用真人主播,在閑時用數(shù)字人作為補充。
高叢告訴「定焦」,下一代數(shù)字人直播產(chǎn)品會向改進中之人、接入大模型兩個方向發(fā)展,都是為了改進互動體驗,更接近真人,但目前成本較高。
“抖音”上的數(shù)字人,會涼嗎?
“中小企業(yè)主被割韭菜了,代理公司賺了一波錢,數(shù)字人技術公司走上了風口,造就了一批明星創(chuàng)業(yè)公司。”宋欣鑫這樣總結當前的數(shù)字人產(chǎn)業(yè)鏈。至于后續(xù)的發(fā)展如何,除了技術進展,要看市場的接受度,而主要的需求方都在觀望平臺的態(tài)度。
客戶使用數(shù)字人,無非是想降本或創(chuàng)收?!鞍ㄟ^去一段時間,跨境電商、本地生活領域(餐飲、酒旅為主)的商家,對數(shù)字人熱情高漲,就是因為跨境電商對降本的訴求更迫切,本地生活商家正處在線上化的階段?!敝芤宦贩治?。
數(shù)字人在本地生活直播間的應用,圖源 / 硅基智能視頻號
就連MCN(主播和網(wǎng)絡紅人運營方)也因此盯上了數(shù)字人。電商平臺相關負責人程成告訴「定焦」,謙尋等一些頭部MCN在做數(shù)字人相關產(chǎn)品,不是給當家主播做一個數(shù)字版的“XXX”,而是打造成招商案例賣給商家。
代理、MCN、市場都在傳遞一種觀點,店播是數(shù)字人直播的主場。很多商家的確對數(shù)字人產(chǎn)品很感興趣,但最顧慮的除了效果不理想,就是賬號封停。
“據(jù)我所知,很多商家都被封怕了”,跨境電商商家王晨對「定焦」介紹,自己半年前花費3萬,從一家數(shù)字人技術公司那里,定制了一款數(shù)字人,當時對方承諾不會被平臺封禁,但在TikTok直播時還是屢次被封。
他補充說,一個數(shù)字人直播間成本幾千元,對比每月成本至少兩萬的真人直播,的確降了成本,但加上被封的風險,就太不劃算了。最關鍵的是,平臺會給數(shù)字人推多少流量,轉(zhuǎn)化怎么樣,都要打個問號。
張現(xiàn)說,以抖音為主的平臺加大監(jiān)管力度后,近三個月數(shù)字人產(chǎn)品的銷售明顯受到影響;因為試錯成本太高,很多正在談的客戶更不愿意用大號嘗試數(shù)字人。
過去平臺對數(shù)字人的態(tài)度是模糊的。因為平臺的KPI是用戶體驗和商業(yè)轉(zhuǎn)化,數(shù)字人都不是平臺完成KPI的最優(yōu)解。宋欣鑫對「定焦」分析,平臺希望內(nèi)容池不斷豐富,創(chuàng)作門檻降低,理想情況下,數(shù)字人視頻和直播能滿足這一點,但現(xiàn)狀是,數(shù)字人內(nèi)容質(zhì)量不穩(wěn)定,只是拉時長而已。
近期,這個產(chǎn)業(yè)的發(fā)展超出預期,各方勢力涌入,甚至亂象滋生,平臺有必要加大管控力度,但如果平臺監(jiān)管過嚴,也有可能把流量和商家“推”向其他平臺。
如今,主流的視頻、直播平臺的態(tài)度逐漸清晰:抖音推出《數(shù)字人行業(yè)倡議》;淘寶向商家開放數(shù)字人,價格比第三方高,但被封的概率低;還有快手、京東,都在把數(shù)字人作為一個功能工具推向達人、MCN。
但因為平臺特性不同,各家還是存在差別。淘寶直播、快手,以及拼多多、京東整體比較寬松;抖音的平臺規(guī)則最為嚴格。
“抖音和淘寶直播都是直播電商,為什么態(tài)度不同?”周一路對「定焦」分析,核心是看數(shù)字人直播對平臺的商業(yè)轉(zhuǎn)化貢獻如何。抖音的興趣電商,主打的是興趣、情緒和隨機性,現(xiàn)在的數(shù)字人完全比不了真人;而淘寶直播是貨架電商,用戶帶著購買目標進直播間,即便看到是機器人在賣貨,只要價格便宜,也不太影響下單。
大量從業(yè)者在揣摩平臺的想法,程成總結道,其實不復雜,站在平臺的立場,平臺需要數(shù)字人相關工具提高真人內(nèi)容的效率,但絕非完全取代真人,所以,讓數(shù)字人24小時開播,試圖取代真人的,是平臺打擊的,反之,則是平臺允許的。
數(shù)字人此前應用到了影視、游戲和金融領域,當它進入直播和視頻,幾百元一個的數(shù)字人似乎正在“飛入尋常百姓家”,但表象之下,這個市場正處于爆發(fā)與無序的狀態(tài)。
結合多位受訪者的觀點,和很多新鮮事物一樣,數(shù)字人必然要經(jīng)歷這樣一個發(fā)展階段:起初是被追捧、被嚴重高估,在遭遇問題后質(zhì)疑聲四起,問題集中爆發(fā)后平臺下場整治。經(jīng)歷調(diào)整、去泡沫,等待技術相對成熟后,數(shù)字人才會迎來真正的黃金期,到時候只有少部分人能站穩(wěn)腳跟。
而在此之前的很長一段時間里,技術方還會繼續(xù)鼓吹AI和數(shù)字人是大勢所趨,同類型公司在資本市場非常搶手,代理商總是搶先嗅到商機,更有無數(shù)商家前赴后繼入場,平臺則繼續(xù)在內(nèi)容和商業(yè)之間尋找平衡。這之中有機會也有陷阱,身處其中的我們,要時刻保持對新變化的關注和警醒。
應受訪者要求,文中王力、周一路、宋欣鑫、張現(xiàn)、程成、王晨、高叢為化名。