正在閱讀:

美圖視覺大模型再更新,廣告、電商等五行業(yè)成重點(diǎn)落地方向

掃一掃下載界面新聞APP

美圖視覺大模型再更新,廣告、電商等五行業(yè)成重點(diǎn)落地方向

積極推動(dòng)視覺大模型與生產(chǎn)端結(jié)合已成為美圖的發(fā)力點(diǎn)。

圖片來源:視覺中國(guó)

界面新聞?dòng)浾?| 于浩

美圖視覺大模型再次迭代。

10月9日,美圖發(fā)布了其自研AI視覺大模型MiracleVision3.0版,與現(xiàn)有工作流的結(jié)合、在應(yīng)用場(chǎng)景的實(shí)際落地仍是美圖發(fā)力AI的重點(diǎn)方向。

“目前市面上的大部分視覺大模型都在卷數(shù)據(jù)量和參數(shù)量,但我們認(rèn)為,衡量能力的標(biāo)準(zhǔn)并非在追求參數(shù)指標(biāo),而是要抓住應(yīng)用場(chǎng)景的核心需求,并在商業(yè)模式上得到驗(yàn)證。”美圖公司創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官吳欣鴻表示。

美圖視覺大模型至今已迭代了三個(gè)版本,據(jù)美圖公司技術(shù)副總裁、美圖影像研究院負(fù)責(zé)人劉洛麒介紹,1.0的目標(biāo)在于搭建大模型架構(gòu),2.0是構(gòu)建高質(zhì)量數(shù)據(jù)集提升美學(xué)能力,3.0則更強(qiáng)調(diào)模型的可控性,使大模型可以滿足用戶在細(xì)節(jié)把控、局部編輯等方面的需求。

從視覺大模型的落地現(xiàn)狀來看,在生成效果、結(jié)果可控性以及適用范圍方面都亟待完善。大中型企業(yè)需要考慮AI創(chuàng)作的不可控性所帶來的風(fēng)險(xiǎn);中小微企業(yè)對(duì)于效果精度要求相對(duì)較低,缺少部署的技術(shù)能力;個(gè)體用戶方面也面臨著寫好提示詞等具體的使用門檻。

吳欣鴻將AI視覺大模型在生產(chǎn)端落地方面的待解問題歸結(jié)為:垂直領(lǐng)域的極致效果、工作流整合、變現(xiàn)能力。三者分別對(duì)應(yīng)模型能力的提升、多人協(xié)作中的上下游協(xié)同以及模型對(duì)商業(yè)場(chǎng)景的理解。 

3.0版可以視作美圖針對(duì)上述問題進(jìn)行的探索。據(jù)吳欣鴻所述,MiracleVision的核心能力具備“奇思妙想”和“智能創(chuàng)作”兩種特性。 

所謂“奇思妙想”,是指大模型可通過“提示詞智能聯(lián)想”功能降低用戶使用門檻。當(dāng)用戶輸入關(guān)鍵詞后,大模型可自動(dòng)補(bǔ)充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等;此外,大模型可通過“提示詞精準(zhǔn)控制”功能來滿足更加專業(yè)的設(shè)計(jì)要求,如使用“近景”、“遠(yuǎn)景”、“順光”、“逆光”等描述控制最終生成效果。 

在“智能創(chuàng)作”層面,MiracleVision通過“深化創(chuàng)作”功能,可以進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力;“AI畫面擴(kuò)展”功能則讓作品尺寸更大、細(xì)節(jié)更豐富;“局部修改”功能可對(duì)部分畫面進(jìn)行精準(zhǔn)修改與調(diào)整。此外,“分辨率提升”功能支持生成高清大圖,細(xì)節(jié)表現(xiàn)、色彩展示、物體辨識(shí)會(huì)更加精準(zhǔn)和生動(dòng)。

積極推動(dòng)視覺大模型與生產(chǎn)端結(jié)合已成為美圖的發(fā)力重點(diǎn),電商、廣告、游戲、動(dòng)漫、影視則是其希望先期落地的五大行業(yè)。

美圖公司集團(tuán)高級(jí)副總裁、影像與設(shè)計(jì)產(chǎn)品事業(yè)群總裁陳劍毅在接受界面新聞等媒體采訪時(shí)表示,選擇行業(yè)時(shí)會(huì)更多地考慮與互聯(lián)網(wǎng)的相關(guān)性,如電商就是互聯(lián)網(wǎng)的原生行業(yè);其次會(huì)觀察行業(yè)內(nèi)長(zhǎng)尾效應(yīng)是否明顯,長(zhǎng)尾性強(qiáng)的會(huì)有更多中小玩家,這類客戶對(duì)生成效果相對(duì)不敏感,更利于快速跑通模式,產(chǎn)生商業(yè)價(jià)值。

在AIGC方面,美圖并不回避對(duì)商業(yè)回報(bào)的追求。吳欣鴻此前接受36氪采訪時(shí)曾表示,對(duì)于影像生產(chǎn)力工具而言,月活數(shù)據(jù)與付費(fèi)用戶數(shù)據(jù)都重要,但非要二選一的話,付費(fèi)用戶數(shù)據(jù)更重要,“我們非常需要有造血能力。”

自研大模型的研發(fā)投入、算力成本都需要收入的支撐。但以大模型為基礎(chǔ)的應(yīng)用與傳統(tǒng)移動(dòng)互聯(lián)網(wǎng)應(yīng)用不同,用戶每用一次,廠商都要承擔(dān)算力成本,用的人越多,需要承擔(dān)的邊際成本也更高。

截至目前,視覺大模型的研發(fā)及相關(guān)應(yīng)用的開放并未影響到美圖的利潤(rùn)表現(xiàn)。2023年上半年,美圖研發(fā)投入占總營(yíng)收比重為23.31%,低于2022年同期的27.34%,毛利率則由去年同期的51.8%增至59.8%。

這與VIP訂閱及SaaS相關(guān)業(yè)務(wù)的增長(zhǎng)不無關(guān)系,此外美圖也在嘗試以“美豆”為代表的單購(gòu)模式。與VIP訂閱模式相比,按次數(shù)付費(fèi)的單購(gòu)模式消費(fèi)門檻更低。

吳欣鴻將單購(gòu)視作對(duì)訂閱模式的補(bǔ)充,稱未來會(huì)以兩種模式為基礎(chǔ)反復(fù)進(jìn)行策略驗(yàn)證?!坝嗛喎矫?,未來不排除針對(duì)特定行業(yè)的專業(yè)需求增加更高級(jí)別會(huì)員的可能,”他強(qiáng)調(diào),“單購(gòu)模式下的一些生產(chǎn)力場(chǎng)景也可能會(huì)有更高的服務(wù)價(jià)格。   

至于目前美圖視覺大模型所處的階段,吳欣鴻坦言仍在探索期,2024年至2025年會(huì)是高速發(fā)展期,2026年至2030年為成熟期?!疤剿髌谑球?yàn)證視覺大模型在工作流里支持單任務(wù)提效的可行性,明后年效果會(huì)逐步精進(jìn),有明確的場(chǎng)景、為工作流帶來升級(jí)。”他相信,進(jìn)入成熟期時(shí),視覺大模型在生產(chǎn)端的應(yīng)用會(huì)更加完善。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

美圖

4.5k
  • 美圖奇想大模型單次生成視頻時(shí)長(zhǎng)提升至1分鐘
  • 美圖公司:上半年經(jīng)調(diào)整后歸母凈利潤(rùn)約2.73億元,同比增80.3%

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

美圖視覺大模型再更新,廣告、電商等五行業(yè)成重點(diǎn)落地方向

積極推動(dòng)視覺大模型與生產(chǎn)端結(jié)合已成為美圖的發(fā)力點(diǎn)。

圖片來源:視覺中國(guó)

界面新聞?dòng)浾?| 于浩

美圖視覺大模型再次迭代。

10月9日,美圖發(fā)布了其自研AI視覺大模型MiracleVision3.0版,與現(xiàn)有工作流的結(jié)合、在應(yīng)用場(chǎng)景的實(shí)際落地仍是美圖發(fā)力AI的重點(diǎn)方向。

“目前市面上的大部分視覺大模型都在卷數(shù)據(jù)量和參數(shù)量,但我們認(rèn)為,衡量能力的標(biāo)準(zhǔn)并非在追求參數(shù)指標(biāo),而是要抓住應(yīng)用場(chǎng)景的核心需求,并在商業(yè)模式上得到驗(yàn)證。”美圖公司創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官吳欣鴻表示。

美圖視覺大模型至今已迭代了三個(gè)版本,據(jù)美圖公司技術(shù)副總裁、美圖影像研究院負(fù)責(zé)人劉洛麒介紹,1.0的目標(biāo)在于搭建大模型架構(gòu),2.0是構(gòu)建高質(zhì)量數(shù)據(jù)集提升美學(xué)能力,3.0則更強(qiáng)調(diào)模型的可控性,使大模型可以滿足用戶在細(xì)節(jié)把控、局部編輯等方面的需求。

從視覺大模型的落地現(xiàn)狀來看,在生成效果、結(jié)果可控性以及適用范圍方面都亟待完善。大中型企業(yè)需要考慮AI創(chuàng)作的不可控性所帶來的風(fēng)險(xiǎn);中小微企業(yè)對(duì)于效果精度要求相對(duì)較低,缺少部署的技術(shù)能力;個(gè)體用戶方面也面臨著寫好提示詞等具體的使用門檻。

吳欣鴻將AI視覺大模型在生產(chǎn)端落地方面的待解問題歸結(jié)為:垂直領(lǐng)域的極致效果、工作流整合、變現(xiàn)能力。三者分別對(duì)應(yīng)模型能力的提升、多人協(xié)作中的上下游協(xié)同以及模型對(duì)商業(yè)場(chǎng)景的理解。 

3.0版可以視作美圖針對(duì)上述問題進(jìn)行的探索。據(jù)吳欣鴻所述,MiracleVision的核心能力具備“奇思妙想”和“智能創(chuàng)作”兩種特性。 

所謂“奇思妙想”,是指大模型可通過“提示詞智能聯(lián)想”功能降低用戶使用門檻。當(dāng)用戶輸入關(guān)鍵詞后,大模型可自動(dòng)補(bǔ)充相關(guān)表述,如光影效果、質(zhì)感、風(fēng)格、圖片質(zhì)量等;此外,大模型可通過“提示詞精準(zhǔn)控制”功能來滿足更加專業(yè)的設(shè)計(jì)要求,如使用“近景”、“遠(yuǎn)景”、“順光”、“逆光”等描述控制最終生成效果。 

在“智能創(chuàng)作”層面,MiracleVision通過“深化創(chuàng)作”功能,可以進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力;“AI畫面擴(kuò)展”功能則讓作品尺寸更大、細(xì)節(jié)更豐富;“局部修改”功能可對(duì)部分畫面進(jìn)行精準(zhǔn)修改與調(diào)整。此外,“分辨率提升”功能支持生成高清大圖,細(xì)節(jié)表現(xiàn)、色彩展示、物體辨識(shí)會(huì)更加精準(zhǔn)和生動(dòng)。

積極推動(dòng)視覺大模型與生產(chǎn)端結(jié)合已成為美圖的發(fā)力重點(diǎn),電商、廣告、游戲、動(dòng)漫、影視則是其希望先期落地的五大行業(yè)。

美圖公司集團(tuán)高級(jí)副總裁、影像與設(shè)計(jì)產(chǎn)品事業(yè)群總裁陳劍毅在接受界面新聞等媒體采訪時(shí)表示,選擇行業(yè)時(shí)會(huì)更多地考慮與互聯(lián)網(wǎng)的相關(guān)性,如電商就是互聯(lián)網(wǎng)的原生行業(yè);其次會(huì)觀察行業(yè)內(nèi)長(zhǎng)尾效應(yīng)是否明顯,長(zhǎng)尾性強(qiáng)的會(huì)有更多中小玩家,這類客戶對(duì)生成效果相對(duì)不敏感,更利于快速跑通模式,產(chǎn)生商業(yè)價(jià)值。

在AIGC方面,美圖并不回避對(duì)商業(yè)回報(bào)的追求。吳欣鴻此前接受36氪采訪時(shí)曾表示,對(duì)于影像生產(chǎn)力工具而言,月活數(shù)據(jù)與付費(fèi)用戶數(shù)據(jù)都重要,但非要二選一的話,付費(fèi)用戶數(shù)據(jù)更重要,“我們非常需要有造血能力?!?/span>

自研大模型的研發(fā)投入、算力成本都需要收入的支撐。但以大模型為基礎(chǔ)的應(yīng)用與傳統(tǒng)移動(dòng)互聯(lián)網(wǎng)應(yīng)用不同,用戶每用一次,廠商都要承擔(dān)算力成本,用的人越多,需要承擔(dān)的邊際成本也更高。

截至目前,視覺大模型的研發(fā)及相關(guān)應(yīng)用的開放并未影響到美圖的利潤(rùn)表現(xiàn)。2023年上半年,美圖研發(fā)投入占總營(yíng)收比重為23.31%,低于2022年同期的27.34%,毛利率則由去年同期的51.8%增至59.8%。

這與VIP訂閱及SaaS相關(guān)業(yè)務(wù)的增長(zhǎng)不無關(guān)系,此外美圖也在嘗試以“美豆”為代表的單購(gòu)模式。與VIP訂閱模式相比,按次數(shù)付費(fèi)的單購(gòu)模式消費(fèi)門檻更低。

吳欣鴻將單購(gòu)視作對(duì)訂閱模式的補(bǔ)充,稱未來會(huì)以兩種模式為基礎(chǔ)反復(fù)進(jìn)行策略驗(yàn)證?!坝嗛喎矫?,未來不排除針對(duì)特定行業(yè)的專業(yè)需求增加更高級(jí)別會(huì)員的可能,”他強(qiáng)調(diào),“單購(gòu)模式下的一些生產(chǎn)力場(chǎng)景也可能會(huì)有更高的服務(wù)價(jià)格。   

至于目前美圖視覺大模型所處的階段,吳欣鴻坦言仍在探索期,2024年至2025年會(huì)是高速發(fā)展期,2026年至2030年為成熟期?!疤剿髌谑球?yàn)證視覺大模型在工作流里支持單任務(wù)提效的可行性,明后年效果會(huì)逐步精進(jìn),有明確的場(chǎng)景、為工作流帶來升級(jí)。”他相信,進(jìn)入成熟期時(shí),視覺大模型在生產(chǎn)端的應(yīng)用會(huì)更加完善。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。