記者|崔鵬
2022年1月14日,百度智能云AI人機交互實驗室負責人李士巖表示,通過百度智能云曦靈平臺的開放,兩年內有望讓每個人實現(xiàn)數(shù)字人自由。
百度官方表示,數(shù)字人經(jīng)歷了以“紙片人”為代表的1.0階段,以Vtuber主播為代表的2.0時代,已進化至具備模型高精、人工智能驅動的3.0時代。
李士巖介紹稱,第三代數(shù)字人的建模和內容生產(chǎn)均有AI參與,這使得數(shù)字人的制作效率更高、也更智能,可面向全群體用戶,可由視頻、直播、chatbot等載體承載,更具備千人千面的互動能力。
雖然數(shù)字人行業(yè)擁有強勁的驅動力,但李士巖認為,當下國內數(shù)字人要大規(guī)模產(chǎn)業(yè)落地還面臨三大難題。
首先,數(shù)字人產(chǎn)業(yè)鏈各個節(jié)點相對割裂,導致數(shù)字人在制作和調優(yōu)上存在較高壁壘;其次,服務場景與演藝場景沒有有效打通,表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務能力,而服務型數(shù)字人缺乏人設;第三是滿足高機動性、高頻需求的成本依舊很高。
百度表示,其數(shù)字人平臺“曦靈”就是為了解決這些問題。2021年12月,百度create大會(百度AI開發(fā)者大會)上,百度CTO王海峰正式發(fā)布“百度智能云曦靈數(shù)字人平臺”。
百度方面表示,目前該產(chǎn)品已具備標準平臺的快速交付能力,幫助不同領域客戶快速實現(xiàn)敏捷型需求。
李士巖以數(shù)字人生成環(huán)節(jié)為例,演示了百度智能云曦靈平臺的功能。用戶在百度智能云曦靈平臺上傳一張照片,就能快速生成一個可被AI驅動的2D數(shù)字人像,以前的兩三個月耗時現(xiàn)在被壓縮到小時級。
在數(shù)字人3.0階段,基于市場使用場景,數(shù)字人可以分為演藝型數(shù)字人、服務型數(shù)字人兩類。
演藝術型數(shù)字人包括虛擬主播、虛擬偶像以及數(shù)字孿生的虛擬品牌代言人。目前百度已經(jīng)打造了AI手語主播、央視網(wǎng)虛擬主持人小C、航天局火星車數(shù)字人祝融號、百度虛擬代言人希加加、百度APP代言人龔俊等數(shù)字人。
服務型數(shù)字人包括數(shù)字員工、虛擬員工、虛擬業(yè)務員等。目前百度已經(jīng)和浦發(fā)銀行、光大銀行、中國聯(lián)通合作,推出了一對一服務型數(shù)字人。