阿里圖生視頻AI模型EMO亮相,蒙娜麗莎發(fā)聲,赫本驚艷獻(xiàn)唱

發(fā)布時間:4.8w

界面Vnews

財經(jīng)熱點,現(xiàn)場呈現(xiàn) 聚焦財經(jīng)商業(yè)領(lǐng)域視頻報道

更多

編導(dǎo):宋美辰   編輯:劉春 、江旭波    

日前,阿里巴巴集團(tuán)智能計算研究院上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架”。據(jù)悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時可以根據(jù)輸入視頻的長度生成任何持續(xù)時間的視頻。

精彩回顧

評論

暫無評論哦,快來評價一下吧!