文|豹變 宋子豪
編輯 | 劉楊
「核心提示」
最近,網(wǎng)絡(luò)上出現(xiàn)了一批AI“復(fù)活”逝去親人的商家,從“能活動(dòng)的照片”到“可以進(jìn)行對(duì)話”,應(yīng)有盡有?!皬?fù)活”的倫理邊界在哪里?只靠高科技能支撐這門生意嗎?
AI技術(shù)的進(jìn)步讓“復(fù)活”逝去的親人成為了可能。
小紅書博主李稚氣用AI相關(guān)知識(shí),讓已經(jīng)去世的姥爺重新開口向自己說話。下一步,她還計(jì)劃賦予“姥爺”對(duì)話能力,讓媽媽能與其交流溝通。
所謂“復(fù)活”親人,是指將個(gè)體的生活數(shù)據(jù)、照片、視頻以及聲音等信息上傳至數(shù)字平臺(tái),從而創(chuàng)造出一個(gè)逼真的數(shù)字化版本。這個(gè)數(shù)字分身可以通過虛擬現(xiàn)實(shí)、人工智能和增強(qiáng)現(xiàn)實(shí)等技術(shù)與用戶進(jìn)行互動(dòng)。
隨著這種情感需求的增加,出現(xiàn)了一批號(hào)稱“五塊錢復(fù)活去世親人”為噱頭的商家,他們的服務(wù)價(jià)格從5元到上萬不等,效果也不盡相同。
但這也引起了人們的擔(dān)憂,倫理上如何看待復(fù)活的親人?
“復(fù)活”親人的生意
小紅書博主李稚氣利用AI讓姥爺“復(fù)活”了。
在李稚氣的視頻里,已經(jīng)去世的姥爺重新開口說話,用方言叫自己小名,問自己吃沒吃飯,還告訴她最近天氣冷,多注意身體。
這一切起源于李稚氣最近看到的一則微博熱搜——“浙江父親想要AI復(fù)活兒子”。李稚氣的姥爺幾年前去世,她一直很遺憾沒能見到姥爺最后一面。加上她本來就AI行業(yè)的從業(yè)者,就有了“復(fù)活”姥爺?shù)南敕?,并且她也想把姥爺?shù)腁I數(shù)字人分身給媽媽看看。
李稚氣表示,其實(shí)市面上已經(jīng)有數(shù)字人的產(chǎn)品,但是不管是騰訊的智影,還是字節(jié)跳動(dòng)的剪映,都是提供數(shù)字人的模板,想要生成一個(gè)自己專屬的、親人形象的數(shù)字人,可以選擇的產(chǎn)品相對(duì)較少,并且訓(xùn)練成本也比較高。
“假如我要用智影訓(xùn)練一個(gè)新的數(shù)字人,首年照片定制數(shù)字人形象的價(jià)格為3999元,視頻定制數(shù)字人形象的價(jià)格為7999元,這對(duì)普通人來說太貴了。”
好在憑借自己的專業(yè)能力,李稚氣通過一些相關(guān)的報(bào)道,還有看一些AI生成的視頻,就能大致知道背后的邏輯,并且很快復(fù)現(xiàn)出來。
“不是我一個(gè)人做出來的,我們團(tuán)隊(duì)里做算法崗位的小伙伴兒也一起幫忙?!崩钪蓺獗硎荆龥]用國(guó)內(nèi)大廠的軟件,主要是對(duì)國(guó)外的數(shù)字人成功案例進(jìn)行復(fù)現(xiàn),其中有一些國(guó)外的開源代碼,但要自己做工程化的處理,比如調(diào)整音色,口型的驅(qū)動(dòng)等。
基于一張姥爺?shù)恼掌傻膱D像,搭配上訓(xùn)練好的姥爺音色模型,就可以輸出“姥爺本人講話”的視頻了。
這個(gè)過程中,李稚氣也遇到一些問題,比如如何復(fù)現(xiàn)姥爺?shù)囊羯?。目前普通話的語(yǔ)音克隆比較容易實(shí)現(xiàn),但李稚氣的姥爺說的是陜西方言,所以在聲音克隆上不理想,也沒有大量的方言數(shù)據(jù)讓她去訓(xùn)練模型。
李稚氣采用的方法是,通過普通話相似的語(yǔ)音代替陜西方言,聽起來比較接近姥爺?shù)目谝?。下一步李稚氣還打算收集一些姥爺過往的視頻素材,基于視頻訓(xùn)練姥爺?shù)摹皵?shù)字生命”。
“我的目標(biāo)是接入LLM,開發(fā)一個(gè)H5,讓家人都可以和‘姥爺’聊天。”她說。
在李稚氣把視頻分享到小紅書上之后,有很多網(wǎng)友咨詢,希望她分享教程,這也讓李稚氣有了一個(gè)新的想法,把現(xiàn)在部署在本地的工具開發(fā)成線上工具,讓大家都可以用。
有類似需求的人不在少數(shù),但并不是所有人都有技術(shù)能力。
小紅書、B站等平臺(tái)AI復(fù)活教程都能吸引一大批粉絲,從事相關(guān)的行業(yè)的阿亮告訴《豹變》,最近網(wǎng)絡(luò)上對(duì)AI復(fù)活親人的關(guān)注度更高了,自己最近幾個(gè)月積累了1萬多粉絲。
在淘寶等電商平臺(tái),有不少做相關(guān)生意的店鋪,聲稱只需要一張親人的照片,就能讓親人復(fù)活。從價(jià)格排序來看,目前最低的只要五塊錢,最高要幾百元。
在使用體驗(yàn)上,收費(fèi)五元的店鋪就是讓這張照片的嘴巴、眼睛等動(dòng)起來,配上音頻,比較粗糙。隨著價(jià)格的提高,功能也多了,提供足夠的錄音或視頻就可以說話,聊天。
還有一些在小紅書進(jìn)行引流的賬號(hào),“復(fù)活”了李玟、吳孟達(dá)等去世的明星,從聲音到外貌到動(dòng)作已經(jīng)非常自然。
不過,《豹變》與相關(guān)從業(yè)者聊過之后,最大的感受就是,現(xiàn)在的AI其實(shí)沒那么神。
AI沒有那么神
李稚氣作為行業(yè)從業(yè)者,看到有些AI公司的宣傳稿,總覺得把AI寫得太神了。
在小紅書上引流的商家阿亮也表示,有些AI生成的圖片,在普通人眼里已經(jīng)很自然了,但是從業(yè)者還是能輕易看出其中的“AI味”,并且許多所謂的AI生成視頻背后,也有一定的人工參與。
阿亮是一家提供親人復(fù)活服務(wù)的創(chuàng)業(yè)公司創(chuàng)始人,去年5月份開始接觸這個(gè)行業(yè),并逐漸開發(fā)出了一系列服務(wù),目前全網(wǎng)粉絲接近3萬,免費(fèi)體驗(yàn)和付費(fèi)使用的人數(shù)加起來有1000多人。
該團(tuán)隊(duì)提供三種服務(wù),一種是免費(fèi)體驗(yàn),體驗(yàn)者提供數(shù)字人的性格描述,就能與數(shù)字人文字對(duì)話。一種是網(wǎng)頁(yè)版數(shù)字人,可以通過聲音視頻回復(fù)消息,這些數(shù)字人的人格穩(wěn)定度要比體驗(yàn)版好得多,需要按月或按年付費(fèi)。
另外還提供定制視頻服務(wù),根據(jù)客戶的資料和AI生成視頻,再通過人工精調(diào),達(dá)到客戶滿意的效果,價(jià)格則根據(jù)客戶要求和投入資源來確定。
在與阿亮的交流過程中,《豹變》發(fā)現(xiàn),行業(yè)里有一個(gè)比較有趣的事實(shí):雖然“AI復(fù)活親人”“數(shù)字生命”這些概念看著很賽博朋克,實(shí)際上,與智能相比,人工才是公司的成本大頭。在篩選客戶和提供咨詢服務(wù)上的人工成本不能少,而且很多咨詢的客戶最終都沒有成交。此外,做短視頻、投放廣告、宣傳稿件都需要花錢。
淘寶店的價(jià)格能壓得這么低,是因?yàn)椴簧俚赇伇澈笫俏挥谌木€城市的攝影館,他們使用PS人工微調(diào)生成視頻,主要依賴人工,當(dāng)?shù)毓べY水平比較低,員工多是固定工資,讓員工在閑暇時(shí)間做,就等于創(chuàng)收。
但對(duì)于以AI為賽道的創(chuàng)業(yè)公司來說,一般都在大城市,人工成本更高,因此采用人工反而不劃算。
對(duì)于AI形象的效果,阿亮也表示,不管是聲音、動(dòng)態(tài)效果還是外貌,目前還遠(yuǎn)做不到完美,“尤其是面對(duì)之前朝夕相處的親人,只要有一點(diǎn)不像,在客戶眼里還是很明顯的?!?/p>
為什么很多客戶愿意接受一個(gè)存在瑕疵的數(shù)字形象?阿亮認(rèn)為,這門生意背后有著非常強(qiáng)烈的情感需求,有些客戶也知道這個(gè)數(shù)字形象不是親人,甚至連聽起來像都很難做到,但客戶需要一個(gè)這樣的情感釋放對(duì)象。
阿亮說,在創(chuàng)業(yè)初期,他的公司只有網(wǎng)頁(yè)版和定制視頻的服務(wù)。有一次,一個(gè)小女孩兒在小紅書上用她媽媽的賬號(hào)向阿亮咨詢,阿亮不知道對(duì)方是小學(xué)生,就向她介紹了這些服務(wù),到了支付環(huán)節(jié),小女孩提出要向媽媽要錢,阿亮才知道對(duì)方的身份,但小女孩的父母沒有同意做數(shù)字形象。
最后,小女孩請(qǐng)求阿亮聽自己講述一下關(guān)于外婆的回憶,在20多分鐘的講述里,一邊講一邊哭。在這個(gè)過程中,阿亮能感覺到這個(gè)小女孩情感得到了釋放,同時(shí)也體會(huì)到,所謂的“AI復(fù)活親人”,正是提供了這樣一個(gè)情感釋放出口。
這也是后來阿亮提供免費(fèi)體驗(yàn)的原因之一。“我得到一批低價(jià)的大廠大模型資源,正好利用這些資源做了一個(gè)免費(fèi)體驗(yàn)的服務(wù)號(hào),一方面可以給其他收費(fèi)服務(wù)引流,一方面也可以讓一些沒有支付能力的人有一個(gè)情感釋放的去處?!?/p>
大廠望而卻步
阿亮團(tuán)隊(duì)的收費(fèi)標(biāo)準(zhǔn)看起來不便宜,對(duì)此,阿亮表示,他參考了一個(gè)國(guó)外的類似服務(wù)收費(fèi)價(jià)格,那個(gè)服務(wù)每月收費(fèi)10美元,折合人民幣大約70多塊,自己按照這個(gè)價(jià)格下調(diào)了一些。
阿亮稱,很多訂單沒有成交不是因?yàn)閮r(jià)格,而是客戶提供的資料不足?!跋蛭易稍兊目蛻舢?dāng)中,有50%的人無法提供親人足夠多的影像資料,有八成客戶甚至完全沒有親人的音頻資料?!?/p>
他也遇到過愿意支付二三十萬的客戶,但阿亮認(rèn)為這類客戶對(duì)“復(fù)活”的效果一般都很挑剔,現(xiàn)在的技術(shù)很難做到,所以沒有接單。
在阿亮看來,這個(gè)賽道非常有發(fā)展?jié)摿?。從最近幾年開始,每個(gè)普通人的影像資料、語(yǔ)音資料都是越來越豐富了。而且隨著科技的進(jìn)步,將來AI生成的效果會(huì)更好,成本也會(huì)更低,可能到那個(gè)時(shí)候才出現(xiàn)爆發(fā)期。
其實(shí)AI復(fù)活親人本質(zhì)上就是數(shù)字人技術(shù),現(xiàn)在國(guó)內(nèi)不少大公司都可以做到。今年2月,阿里就發(fā)布了一款全新生成大模型EMO,有博主利用該技術(shù)生成了張國(guó)榮演唱歌曲的視頻。商湯科技也用AI技術(shù)復(fù)活了因病去世的創(chuàng)始人湯曉鷗教授。
但目前大公司沒有進(jìn)入“復(fù)活親人”的領(lǐng)域:人工智能公司小冰已經(jīng)通過網(wǎng)紅的數(shù)字AI分身,來收取訂閱費(fèi);阿里云提供了數(shù)字人視頻合成產(chǎn)品和數(shù)字人資產(chǎn)構(gòu)建定制服務(wù);百度智能云提供低成本快速定制2D卡通、真人形象及3D卡通、超寫實(shí)數(shù)字人像的服務(wù)。
可以看出,大多數(shù)企業(yè)在數(shù)字分身方面的試水,還停留在公眾人物形象或者虛擬形象階段。原因或許在于,普通人數(shù)字分身的商業(yè)化存在隱患,生成人物的歸屬權(quán)、使用權(quán)等問題,普通用戶比公眾人物還要復(fù)雜。
還有經(jīng)濟(jì)效益的問題。李稚氣提到,普通人對(duì)AI復(fù)活親人有太多定制化的需求,讓企業(yè)無法批量化生產(chǎn)。李稚氣解釋:“如果要做出一個(gè)算法,可以根據(jù)每個(gè)人的要求進(jìn)行微調(diào),成本又太高了,是一個(gè)投產(chǎn)比很低的事情?!?/p>
此外,在倫理方面可能也會(huì)出現(xiàn)一些問題,甚至存在詐騙的隱患。
據(jù)媒體報(bào)道,中國(guó)香港警方發(fā)現(xiàn)有詐騙分子利用AI換臉技術(shù),通過YouTube等平臺(tái)獲取了英國(guó)公司高管的影像資料訓(xùn)練AI,成功仿造了英國(guó)公司高管的形象和聲音,在網(wǎng)上會(huì)議中騙走了2億港元。
雖然,科技大廠對(duì)“復(fù)活”親人這個(gè)敏感賽道望而卻步,但是所謂“復(fù)活”親人的賽道里,卻處處能看到大廠的影子。
一位從業(yè)者告訴《豹變》,自家產(chǎn)品的對(duì)話能力來自于一家國(guó)內(nèi)大廠的大模型,行業(yè)內(nèi)也有不少商家都是通過國(guó)內(nèi)外大廠旗下軟件的能力實(shí)現(xiàn)服務(wù)。
李稚氣、阿亮也表示,目前這個(gè)賽道內(nèi)的大部分商家都沒有自研能力,所以推動(dòng)行業(yè)進(jìn)步主要還是靠大公司的研發(fā),也許當(dāng)大廠推出完美數(shù)字人的時(shí)候,讓親人復(fù)活將成為可能。
(應(yīng)受訪者要求,文中人物均為化名)