界面新聞記者 | 陳振芳
界面新聞編輯 | 宋佳楠
6月12日,美圖公司(01357.HK)一口氣發(fā)布及更新了6款產(chǎn)品,包括美圖云修V2、開拍V2、美圖設(shè)計室V3、站酷設(shè)計服務(wù)、奇覓及MOKI,覆蓋商業(yè)攝影、游戲營銷、視頻生成等多個領(lǐng)域。
MOKI是該公司新發(fā)布的AI短片創(chuàng)作平臺,主要輔助創(chuàng)作者制作動畫短片、網(wǎng)文短劇、故事繪本和MV。該平臺將于7月31日推出。
據(jù)界面新聞了解,目前美圖產(chǎn)品所需的AI模型能力,均由美圖奇想大模型(MiracleVision)提供。該模型已迭代到V5版本,采用自研DiT技術(shù)架構(gòu),涵蓋圖像大模型、視頻大模型、音頻大模型和文本大模型。
美圖公司創(chuàng)始人、董事長兼首席執(zhí)行官吳欣鴻認為,AI應(yīng)用將經(jīng)歷點、線、面三個階段,美圖正嘗試把AI單點功能串聯(lián)起來,以運用到電商、廣告、游戲、影視、動漫等行業(yè)。 例如在MOKI上,輸入一個簡單的故事劇本后,模型可將短片操作流程進行結(jié)構(gòu)化拆解,然后生成短片。
這并非美圖首創(chuàng)。早在今年2月,OpenAI發(fā)布的Sora便在文生視頻領(lǐng)域掀起了一輪巨浪,此后有多家大模型相關(guān)公司跟進。但美圖方面表示,用類似的文生視頻模型輔助內(nèi)容創(chuàng)作,故事成片難,可控性較差。
在吳欣鴻看來,文生視頻領(lǐng)域涉及蒙太奇等多種剪輯效果,可控性遠比時長更重要,它意味著AI需要完成各種各樣的復(fù)雜工作。
文生視頻的另一難題還在于,用戶輸入一整篇小作文才能輸出短片,且要考慮場景、人物、運動軌跡以及各種精細化的視頻內(nèi)容呈現(xiàn)。但現(xiàn)實情況是,很多內(nèi)容難以用文字去描述清楚。
即便Sora仍有種種不足,要在短期內(nèi)追上它的技術(shù)能力和生成效果并不容易。對此,美團的策略是“不在模型側(cè)一味硬碰硬”。
吳欣鴻指出,如果在文生視頻領(lǐng)域“硬剛”,其競爭對手會是全球巨頭。無論在資金投入還是算法層面,美圖與巨頭們都存在一定差距。但在應(yīng)用層,該公司希望通過提供一站式的內(nèi)容創(chuàng)作方案來搶占更多市場。
為了能更好地“控制”其應(yīng)用,這家公司選擇自研大模型。“如果我們用外部API或者開源大模型,很難在底層進行深度開發(fā)。 ”吳欣鴻向界面新聞表示,目前AI技術(shù)領(lǐng)先于AI應(yīng)用,將AI概念轉(zhuǎn)化為優(yōu)秀產(chǎn)品的并不多。
不少大模型公司都在追求參數(shù)量、打榜,以證明自己的技術(shù)實力和資金投入,背后卻是高昂的成本,以及由此帶來的商業(yè)化挑戰(zhàn)。
美圖試圖在投入和盈利之間尋求平衡。“搞模型軍備競賽不是美圖的核心戰(zhàn)略,我們會在保證應(yīng)用競爭力的前提下,控制模型的投入。”他還強調(diào),過去很長時間美圖都是常年虧損,所以會更看重落地場景和商業(yè)模式?!?/p>
吳欣鴻認可“模型即應(yīng)用是大趨勢”,也注意到國內(nèi)很多大模型公司都在往應(yīng)用方向走,或快或慢。他相信應(yīng)用會是十倍于模型本身的市場空間。
從此次發(fā)布的產(chǎn)品可知,這家公司有意回歸最為熟悉的影像領(lǐng)域,且正在設(shè)法爭取更多企業(yè)用戶。
近年來,其曾做過多元化嘗試,涉足手機制造、電子商務(wù)、金融科技等領(lǐng)域,但頻頻受挫。當(dāng)下著力的AI應(yīng)用,也同樣面對來自字節(jié)跳動、騰訊、快手等大型互聯(lián)網(wǎng)公司,以及新晉大模型獨角獸們的圍追堵截。
該公司2023年財報顯示,其企業(yè)端業(yè)務(wù)收入為5.7億元,占總營收的21%,消費端業(yè)務(wù)占比近50%,營收達13.3億元。企業(yè)端要超過消費端營收,美圖仍有很長的一段路要走。
截至6月12日收盤,美圖公司收盤價為2.78港元,下跌9.74%,總市值126.08億港元。