文|腦極體
冬奧賽事已過半,我們的情緒也在酣暢淋漓的競技中跌宕起伏。在谷愛凌自由式滑雪的比賽中,武大靖代表的短道速滑團體賽的金牌中激昂;也為年輕單板滑雪小將蘇翊鳴的銀牌成績判罰不停爭論,為頂級花滑運動員羽生結(jié)弦的冬奧成績惋惜。
近日大部分的新聞熱搜與情緒都貢獻給了這場頂級的體育盛宴,如果想要獲得一些情緒的喘息,可以嘗試回到冬奧背后的科技與技術(shù)中,為在這個世界櫥窗中展現(xiàn)出的黑科技們自豪一下,平息處在波谷的情緒。
冬奧中出圈的獵豹高速攝像頭,零排放的二氧化碳制冰,突破標準封鎖的人工造雪核心技術(shù),智能動車等,集齊了最為前沿的科技成果。在這個世界窗口中,秀出豐碩的技術(shù)肌肉。在這些技術(shù)成果中,最為顯眼的可能就是各種虛擬數(shù)字人的形象了。如果持續(xù)的關(guān)注賽事,在各類轉(zhuǎn)播平臺中,總會看到虛擬數(shù)字人的忙碌身影,或在無聲中用手語為萬千觀眾播報賽事進程,或在侃侃而談分析賽事。冬奧會上,虛擬人的身影無處不在。
無處不在的冬奧數(shù)字人
從冬奧賽事的舉辦進程來看,虛擬人從一開始就全程參與沒有落下。從最開始的“相約北京”奧林匹克文化節(jié)開幕式上,虛擬歌手洛天依一展歌喉,演唱的《Time to shine》點燃了會場,為冬奧會宣傳助威。
虛擬數(shù)字人偶像只是冬奧會上虛擬數(shù)字人的開場,冬奧會整個場內(nèi)外,都不乏虛擬人的形象存在。
如果從虛擬數(shù)字人的應(yīng)用角度來分類,可以分為服務(wù)型虛擬人和身份型虛擬人。冬奧會的虛擬人也主要為這兩大類。這兩大類型的數(shù)字虛擬人也主要作為冬奧新聞報道的補充存在。
出鏡率最高的就是央視新聞AI手語主播,這位長相親和甜美的手語主播,能夠為觀眾提供專業(yè)、準確的手語解說。并且這位手語虛擬主播有著“24小時無休”的稱號,據(jù)悉在冬奧會結(jié)束后,這位虛擬手語主播將全年無休,為聽力障礙群體做好新聞報道。
AI手語虛擬主播是典型的服務(wù)型虛擬人。而身份型虛擬人則更強調(diào)其人設(shè),如虛擬偶像,真人數(shù)字分身等。
虛擬歌手洛天依,熱搜附體的奧運健兒谷愛凌數(shù)字人分身、央視主播王冰冰數(shù)字人分身、天氣主持人馮殊的數(shù)字人馮小殊等。這些虛擬數(shù)字人憑借其人設(shè)本身,吸引流量,為冬奧賽事報道、解說,給觀眾帶來新奇的體驗。
運動員谷愛凌最近的熱搜報道太多,估計很多讀者被刷屏到厭煩,我們就拿氣象頻道主持人馮殊舉例,看看虛擬數(shù)字人分身的煉成過程。
馮小殊的誕生背后是來自于微軟小冰提供的技術(shù)。據(jù)悉,微軟小冰通過深度神經(jīng)網(wǎng)絡(luò)渲染技術(shù)及小樣本學(xué)習(xí)技術(shù),僅用1周的時間就完成了對馮殊本人的學(xué)習(xí)。經(jīng)過語音、嘴型、人臉渲染專家模型訓(xùn)練,虛擬數(shù)字人可以完美的get馮殊本人的嘴部動作、眼部及臉部肌肉之間的協(xié)同關(guān)系,其面容、表情、肢體動作的整體自然度跟真人幾乎無異。如果沒有特別強調(diào)數(shù)字人身份的話,幾乎以假亂真,完全分辨不出來。
觀察虛擬人在冬奧的應(yīng)用場景,我們會發(fā)現(xiàn),虛擬人從鼻祖初音未來偶像的電腦CG技術(shù),到現(xiàn)在通過AI技術(shù)的升級,可以即時翻譯的手語主播和以假亂真的虛擬人分身的轉(zhuǎn)變,十多年的時間跨度,虛擬數(shù)字人的技術(shù)積累已經(jīng)發(fā)生了質(zhì)的飛躍。技術(shù)驅(qū)動下,數(shù)字虛擬人在冬奧會這個世界櫥窗中,集中展示了近幾年的成果。
虛擬數(shù)字人的崛起
肉眼可見的虛擬數(shù)字人近兩年發(fā)展飛速。清冷古風(fēng)氣質(zhì)的虛擬偶像LING翎、時尚博主AYAYI、虛擬美妝達人柳夜熙,這些帶貨強勁的虛擬主播是許多年輕時尚觀眾熟悉的虛擬數(shù)字人。而在科技圈中,清華大學(xué)知識工程實驗室的虛擬學(xué)生華智冰,這類高度擬人的數(shù)字人向大眾展現(xiàn)了虛擬人最前沿的技術(shù)能力。
落地相較普遍的是虛擬導(dǎo)游、主播、數(shù)字航天員等,這類虛擬人多數(shù)是由科技企業(yè)面向傳統(tǒng)B端客戶推出的數(shù)字人方案服務(wù)。沒有人設(shè)的堆砌,這類虛擬數(shù)字人作為企業(yè)員工的平替,代替企業(yè)進行內(nèi)容的簡單生產(chǎn)與交互,為企業(yè)產(chǎn)品與技術(shù)進行宣傳和服務(wù)。
我們可以從虛擬人的應(yīng)用場景中發(fā)現(xiàn),其應(yīng)用的領(lǐng)域主要為文娛及服務(wù)行業(yè)。無論是數(shù)字偶像日漸成熟的畫面呈現(xiàn)方式,還是融合5G、AI 等綜合技術(shù)能力應(yīng)用提升,虛擬人落地的場景變得逐漸豐富起來。
最卷打工人萬科的虛擬數(shù)字人“崔曉盼”,代表了辦公場景中虛擬人的技術(shù)水平。在系統(tǒng)算法的加持下,崔曉盼可以以遠高于人類千百倍的效率在各種應(yīng)收、逾期提醒及工作異常偵測中大顯身手。她催辦的預(yù)付應(yīng)收/逾期單據(jù)核銷率達到91.44%。
從最開始吸引眼球的精致虛擬偶像到現(xiàn)今在社交、游戲、辦公場景等具體的應(yīng)用,在直播電商、偶像代言、陪伴服務(wù)等,虛擬數(shù)字人都實現(xiàn)了商業(yè)變現(xiàn)。
而背后的技術(shù)服務(wù)商,是一眾技術(shù)與財力雄厚的頭部科技企業(yè),如百度、騰訊、科大訊飛、阿里等,也有AI技術(shù)創(chuàng)企中科智能、云舶科技等。這些企業(yè)在自身AI技術(shù)的積累下與元宇宙的未來中,作為先手部隊以虛擬數(shù)字人切入,搶占虛擬數(shù)字世界的蛋糕。
無論是作為何種身份與技術(shù)能力的展現(xiàn),整個市場呈現(xiàn)出一片繁榮的景象,我們會看到各種虛擬人在不斷地增加。他們的崛起,與AI能力與數(shù)字技術(shù)的高速發(fā)展不無關(guān)系。
深究虛擬人走紅的本質(zhì),是虛擬數(shù)字世界逐漸泛化的展現(xiàn)。現(xiàn)實世界與數(shù)字世界之間的界限不斷融合與模糊,虛擬數(shù)字人是這兩個世界連接最合適的載體,作為虛擬數(shù)字世界的入口,無論是視覺化、沉浸式的體驗,還是綜合技術(shù)的展現(xiàn),虛擬人都在這個天時地利的機遇中,成為兩個世界溝通與融合的橋梁。不過在這個看似百花齊放的市場中,由技術(shù)驅(qū)動虛擬數(shù)字人的發(fā)展仍在發(fā)展的初始階段。
跨越的鴻溝與進化
冬奧會中展現(xiàn)出的數(shù)字人的技術(shù)能力,幾乎代表了現(xiàn)階段數(shù)字虛擬人的最高水平。在5G、AI、數(shù)字技術(shù)等加持下,現(xiàn)階段的虛擬人通過自我學(xué)習(xí)和算法能力可以實現(xiàn)與人語音、手勢的交互。在這類資金實力充足的體育盛事中,集中力量打造與展現(xiàn)符合賽事報道的數(shù)字人相較容易。但在廣泛的落地過程中,虛擬數(shù)字人的發(fā)展仍存在不少的障礙。
從虛擬人的應(yīng)用角度來看,身份類數(shù)字人如偶像洛天依、谷愛凌等數(shù)字分身人等,這類數(shù)字虛擬人需要IP人設(shè)的專人運營。尤其是帶有偶像性質(zhì)的虛擬人,需要過硬的專業(yè)作品與內(nèi)容創(chuàng)作來延續(xù)人設(shè)生命力與商業(yè)價值。這也提高了其應(yīng)用的門檻與成本。據(jù)悉,虛擬偶像的一支單曲從編曲到人物形象、舞臺設(shè)計等就需花費近200萬元,再加上宣發(fā)推廣的費用,培養(yǎng)成本甚至?xí)^真人偶像。
而服務(wù)類的虛擬數(shù)字人,技術(shù)的能力參差不齊。我們對虛擬人的終極想象是與人交互的自然流暢,類似真人交互般的體驗絲滑,但這對虛擬人的綜合技術(shù)能力要求較高。需要在技術(shù)層面諸如NLP、機器視覺、TTS語音合成等多種基礎(chǔ)AI的分析與處理能力都達到頂級水平。對技術(shù)的要求與成本都過高,復(fù)雜的技術(shù)與冗長的定制周期,使其無法快速大范圍推廣。
虛擬數(shù)字人在發(fā)展的過程中,還有無法避免的倫理問題。人臉識別技術(shù)、AI換臉等技術(shù)在落地推廣的過程中,都曾發(fā)生過這類輿論風(fēng)險。類人虛擬人,也會存在對人物原型的假冒替代等風(fēng)險,萬眾矚目的代價就是被無數(shù)放大鏡放大缺陷,帶來滑向深淵的可能。
道的規(guī)律揭示事物在發(fā)展的過程中,總會歷經(jīng)高峰與低谷。一蹴而就達成的結(jié)局也如曇花乍現(xiàn)一般短暫,堅持長遠正確的選擇,是去往星辰大海的必選項。數(shù)字世界無人區(qū)的持續(xù)深耕,荊棘無可避免。
從探索期到成長期,數(shù)字虛擬人仍處在初始爬坡期,智能化水平目前比較初級,無法應(yīng)對復(fù)雜的工作環(huán)境。距離泛化的應(yīng)用還有一段“長坡”需要克服。但在目前這些窗口的展示中,我們也窺見了虛擬數(shù)字人的未來:強大的分析與數(shù)據(jù)處理能力,多元的身份與絲滑的服務(wù),虛擬數(shù)字的世界逐漸豐富與立體。
從平面的圖文影音,到實時絲滑的3d交互,訊息的傳播不斷升維。未來我們也會擁有類似《頭號玩家》中的元宇宙“綠洲”虛擬世界:智慧情感等級類人的數(shù)字人,復(fù)刻數(shù)字面具下的真人,自然流暢的交互體驗,真假難以分辨的虛虛實實。
無論是在現(xiàn)實世界還是虛擬世界,虛擬人都會作為類人生命體的最佳補充,豐富數(shù)字世界,擁有無限的生命力與想象空間。