阿里達(dá)摩院上線“文本生成視頻大模型”,目前只支持英文輸入

發(fā)布時(shí)間:4.6w

界面Vnews

財(cái)經(jīng)熱點(diǎn),現(xiàn)場(chǎng)呈現(xiàn) 聚焦財(cái)經(jīng)商業(yè)領(lǐng)域視頻報(bào)道

更多

編導(dǎo):謝希文   編輯:龍雪晴 、孫曉旭    

近日,阿里達(dá)摩院已在AI模型社區(qū)“魔搭”ModelScope上線了“文本生成視頻大模型”。據(jù)介紹,整體模型參數(shù)約17億,目前只支持英文輸入。擴(kuò)散模型采用Unet3D結(jié)構(gòu),通過(guò)從純高斯噪聲視頻中,迭代去噪的過(guò)程,實(shí)現(xiàn)視頻生成的功能。

精彩回顧

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!