編導(dǎo):宋美辰 編輯:劉春 、江旭波
日前,阿里巴巴集團(tuán)智能計算研究院上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架”。據(jù)悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時可以根據(jù)輸入視頻的長度生成任何持續(xù)時間的視頻。
編導(dǎo):宋美辰 編輯:劉春 、江旭波
日前,阿里巴巴集團(tuán)智能計算研究院上線了一款新的AI圖片-音頻-視頻模型技術(shù)EMO,官方稱其為“一種富有表現(xiàn)力的音頻驅(qū)動的肖像視頻生成框架”。據(jù)悉,用戶只需要提供一張照片和一段任意音頻文件,該框架能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻,同時可以根據(jù)輸入視頻的長度生成任何持續(xù)時間的視頻。
評論