正在閱讀:

從AI寫真到AI擴(kuò)圖,圖像應(yīng)用更易出圈?

掃一掃下載界面新聞APP

從AI寫真到AI擴(kuò)圖,圖像應(yīng)用更易出圈?

未來(lái)AI的發(fā)展方向是什么?

文|鋅刻度 黎炫岐

編輯|李覲麟

不久前人們還忙著在妙鴨相機(jī)排隊(duì)生成寫真,轉(zhuǎn)眼間又開(kāi)始到美圖秀秀使用AI擴(kuò)圖了。

早在7月,美圖秀秀官方微博就曾發(fā)文,稱“AI 擴(kuò)圖”功能現(xiàn)已上線,美圖秀秀 App 和 Wink App 均可以立刻體驗(yàn) AI 擴(kuò)圖功能。而最近,妙鴨逐漸淡出互聯(lián)網(wǎng),AI擴(kuò)圖卻接替了討論熱度。

而近日,快手自研文生圖大模型“可圖”(Kolors) 也開(kāi)啟內(nèi)測(cè)。

事實(shí)上,從ChatGPT火爆全網(wǎng)后,國(guó)內(nèi)的AI相關(guān)應(yīng)用也相繼出現(xiàn)在大眾視野,但從此前的妙鴨,再到如今的美圖秀秀,在C端出圈的多以圖片生成類應(yīng)用為主。

美圖秀秀“截胡”妙鴨,快手在后?

“AI擴(kuò)圖也太牛了,直接拯救旅游廢片”

“我真的要報(bào)警了,AI擴(kuò)圖出來(lái)的效果又搞笑又離譜”

“AI擴(kuò)圖擴(kuò)得不錯(cuò),下次不擴(kuò)了”

……

最近在各大社交媒體平臺(tái),不難見(jiàn)到類似的美圖秀秀AI擴(kuò)圖分享。

據(jù)官方介紹,該功能基于 AI 算法智能識(shí)別,可根據(jù)圖像的上下文和紋理,預(yù)測(cè)、生成缺失的部分,能夠?yàn)樵紙D片帶來(lái)更大畫幅、更廣視角。

目前在美圖秀秀 App 首頁(yè)可找到入口,每人每天有 5 次免費(fèi)體驗(yàn)機(jī)會(huì),可對(duì)圖像進(jìn)行 150%、200%、250%、300% 四種不同比例的擴(kuò)圖,系統(tǒng)預(yù)設(shè)比例為 125%。

鋅刻度留意到,在微博、小紅書等社交媒體平臺(tái),已有不少網(wǎng)友發(fā)布自己的AI擴(kuò)圖圖片。小紅書上#AI擴(kuò)圖#話題已有高達(dá) 2128.4 萬(wàn)的瀏覽量,而抖音上同樣的話題則有超兩百萬(wàn)次播放量。其中在小紅書上,最熱的一篇相關(guān)筆記“被AI擴(kuò)圖嚇暈,AI你的審美別太好”點(diǎn)贊量達(dá)3.3萬(wàn)。

不過(guò),AI擴(kuò)圖出圈也呈現(xiàn)出兩極評(píng)論,大部分需求為“調(diào)整構(gòu)圖,完善背景”的圖片之所以出圈是因?yàn)樾Ч诲e(cuò),但也有不少令人直呼“離譜”的圖片催化了AI擴(kuò)圖出圈,其中包括擴(kuò)圖時(shí)被補(bǔ)充了奇怪的衣服、增加了奇怪的肢體、出現(xiàn)了陌生的臉龐、懸浮在水中的頭顱等等。

部分出圈的AI擴(kuò)圖照片

事實(shí)上,AI擴(kuò)圖并不算新鮮事物。早在今年五月底,Adobe Photoshop 測(cè)試版上線了一個(gè)名為 “Generative Fill”的 AI 圖像合成工具;今年七月份,Midjourney 則更新了“平移擴(kuò)圖”功能,可以將圖片自由前后平移,相較于之前推出的 “Zoom Out”功能里只能固定的“擴(kuò)圖 1.5 倍”或“擴(kuò)圖 2 倍”,顯得更加人性化。

但對(duì)于國(guó)內(nèi)的大部分人而言,對(duì)AI擴(kuò)圖的應(yīng)用還是從美圖秀秀開(kāi)始的。目前對(duì)AI擴(kuò)圖的討論也主要聚焦于美圖秀秀。

值得一提的是,上一次引發(fā)對(duì)AI圖片應(yīng)用討論熱潮的,還是可以生成個(gè)人寫真的妙鴨相機(jī)和生成芭比寫真的“45AI”。然而,幾個(gè)月過(guò)去,在社交媒體上,這兩款小程序的討論度已然下跌,取而代之的是或離譜、或嚇人或“真香”的AI擴(kuò)圖。

如果說(shuō)目前美圖秀秀憑借AI擴(kuò)圖順利“截胡”妙鴨,那不得不提醒一句,還有快手在后。

9月,快手在短視頻評(píng)論開(kāi)始內(nèi)測(cè)“快手AI玩評(píng)”,而據(jù)官方介紹,快手“AI玩評(píng)”依托于快手自研文生圖大模型“可圖”(Kolors)強(qiáng)大的圖像生成能力,用戶可以通過(guò)輸入各種創(chuàng)意文字,一鍵生成海量風(fēng)格圖片,可以更輕松、便捷地在評(píng)論區(qū)進(jìn)行趣味互動(dòng)。

不過(guò),目前在各大社交媒體平臺(tái)關(guān)于“可圖”的討論還較少。

為何圖片生成類應(yīng)用更易出圈?

回溯近幾年來(lái),國(guó)內(nèi) AIGC真正意義上破圈的現(xiàn)象級(jí)產(chǎn)品似乎大多都誕生在圖片這條賽道。

“AI對(duì)話類的也玩過(guò),但總覺(jué)得對(duì)話很傻,也并不如想象中有趣。但是像妙鴨、AI擴(kuò)圖我都用過(guò),確實(shí)會(huì)經(jīng)常收到意料之外的圖片啊,不管是離譜的還是效果不錯(cuò)的,在社交平臺(tái)發(fā)出來(lái)的討論度都還不錯(cuò)?!?0歲的桃子常年刷社交平臺(tái),對(duì)一切新鮮事物都很好奇,但相較于ChatGPT這一類的對(duì)話式AI,她更樂(lè)于嘗試圖片類應(yīng)用。

“圖像相關(guān)的應(yīng)用軟件確實(shí)更容易被用戶接受和使用,因?yàn)樵趹?yīng)用層面,人們對(duì)圖像ai功能的要求偏工具化,用戶對(duì)ai的預(yù)期是很明確的。” 祁隋是國(guó)內(nèi)一科技企業(yè)的算法工程師,他告訴鋅刻度,圖片類應(yīng)用更容易出圈還有技術(shù)方面的原因,“從全球來(lái)看,近10年的AI浪潮是從2012年的一場(chǎng)名為ImageNet的圖像識(shí)別比賽中萌芽,所以AI模型結(jié)構(gòu)也更適合在圖像上應(yīng)用,效果和效率都比文字更好,而在文字上的應(yīng)用一直到2018年 Transformer結(jié)構(gòu)被發(fā)明出來(lái)后,才算勉強(qiáng)勢(shì)均力敵,應(yīng)用領(lǐng)域離C端也相對(duì)較遠(yuǎn),直到最近找到了生成式AI這個(gè)突破口,被大眾所熟知。”

而在中國(guó),文字內(nèi)容生成比圖像內(nèi)容生成的難度也更大,“因?yàn)槲谋居?xùn)練需要大量高質(zhì)量的數(shù)據(jù),中文數(shù)據(jù)從質(zhì)和量上肯定都比英文數(shù)據(jù)更有挑戰(zhàn)性。尤其是對(duì)話式AI是開(kāi)放式的,任務(wù)也更為多元,對(duì)于數(shù)據(jù)質(zhì)量和數(shù)量的需求更是躍升了一個(gè)量級(jí)。” 祁隋稱。

不過(guò),在祁隋看來(lái),未來(lái)AI的發(fā)展方向是圖像+文本的多模態(tài)大模型?!?6氪”此前也曾提到,想要更接近通用人工智能,提高 AI 對(duì)圖像、語(yǔ)音、視頻等多模態(tài)內(nèi)容的理解不可或缺。相較于注重文本交互的單模態(tài)語(yǔ)言模型,多模態(tài)模型能將 AI 領(lǐng)域拓展至識(shí)別、檢測(cè)等更廣泛的領(lǐng)域。

那么,下一個(gè)引發(fā)現(xiàn)象級(jí)關(guān)注的AI應(yīng)用又會(huì)是什么呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

從AI寫真到AI擴(kuò)圖,圖像應(yīng)用更易出圈?

未來(lái)AI的發(fā)展方向是什么?

文|鋅刻度 黎炫岐

編輯|李覲麟

不久前人們還忙著在妙鴨相機(jī)排隊(duì)生成寫真,轉(zhuǎn)眼間又開(kāi)始到美圖秀秀使用AI擴(kuò)圖了。

早在7月,美圖秀秀官方微博就曾發(fā)文,稱“AI 擴(kuò)圖”功能現(xiàn)已上線,美圖秀秀 App 和 Wink App 均可以立刻體驗(yàn) AI 擴(kuò)圖功能。而最近,妙鴨逐漸淡出互聯(lián)網(wǎng),AI擴(kuò)圖卻接替了討論熱度。

而近日,快手自研文生圖大模型“可圖”(Kolors) 也開(kāi)啟內(nèi)測(cè)。

事實(shí)上,從ChatGPT火爆全網(wǎng)后,國(guó)內(nèi)的AI相關(guān)應(yīng)用也相繼出現(xiàn)在大眾視野,但從此前的妙鴨,再到如今的美圖秀秀,在C端出圈的多以圖片生成類應(yīng)用為主。

美圖秀秀“截胡”妙鴨,快手在后?

“AI擴(kuò)圖也太牛了,直接拯救旅游廢片”

“我真的要報(bào)警了,AI擴(kuò)圖出來(lái)的效果又搞笑又離譜”

“AI擴(kuò)圖擴(kuò)得不錯(cuò),下次不擴(kuò)了”

……

最近在各大社交媒體平臺(tái),不難見(jiàn)到類似的美圖秀秀AI擴(kuò)圖分享。

據(jù)官方介紹,該功能基于 AI 算法智能識(shí)別,可根據(jù)圖像的上下文和紋理,預(yù)測(cè)、生成缺失的部分,能夠?yàn)樵紙D片帶來(lái)更大畫幅、更廣視角。

目前在美圖秀秀 App 首頁(yè)可找到入口,每人每天有 5 次免費(fèi)體驗(yàn)機(jī)會(huì),可對(duì)圖像進(jìn)行 150%、200%、250%、300% 四種不同比例的擴(kuò)圖,系統(tǒng)預(yù)設(shè)比例為 125%。

鋅刻度留意到,在微博、小紅書等社交媒體平臺(tái),已有不少網(wǎng)友發(fā)布自己的AI擴(kuò)圖圖片。小紅書上#AI擴(kuò)圖#話題已有高達(dá) 2128.4 萬(wàn)的瀏覽量,而抖音上同樣的話題則有超兩百萬(wàn)次播放量。其中在小紅書上,最熱的一篇相關(guān)筆記“被AI擴(kuò)圖嚇暈,AI你的審美別太好”點(diǎn)贊量達(dá)3.3萬(wàn)。

不過(guò),AI擴(kuò)圖出圈也呈現(xiàn)出兩極評(píng)論,大部分需求為“調(diào)整構(gòu)圖,完善背景”的圖片之所以出圈是因?yàn)樾Ч诲e(cuò),但也有不少令人直呼“離譜”的圖片催化了AI擴(kuò)圖出圈,其中包括擴(kuò)圖時(shí)被補(bǔ)充了奇怪的衣服、增加了奇怪的肢體、出現(xiàn)了陌生的臉龐、懸浮在水中的頭顱等等。

部分出圈的AI擴(kuò)圖照片

事實(shí)上,AI擴(kuò)圖并不算新鮮事物。早在今年五月底,Adobe Photoshop 測(cè)試版上線了一個(gè)名為 “Generative Fill”的 AI 圖像合成工具;今年七月份,Midjourney 則更新了“平移擴(kuò)圖”功能,可以將圖片自由前后平移,相較于之前推出的 “Zoom Out”功能里只能固定的“擴(kuò)圖 1.5 倍”或“擴(kuò)圖 2 倍”,顯得更加人性化。

但對(duì)于國(guó)內(nèi)的大部分人而言,對(duì)AI擴(kuò)圖的應(yīng)用還是從美圖秀秀開(kāi)始的。目前對(duì)AI擴(kuò)圖的討論也主要聚焦于美圖秀秀。

值得一提的是,上一次引發(fā)對(duì)AI圖片應(yīng)用討論熱潮的,還是可以生成個(gè)人寫真的妙鴨相機(jī)和生成芭比寫真的“45AI”。然而,幾個(gè)月過(guò)去,在社交媒體上,這兩款小程序的討論度已然下跌,取而代之的是或離譜、或嚇人或“真香”的AI擴(kuò)圖。

如果說(shuō)目前美圖秀秀憑借AI擴(kuò)圖順利“截胡”妙鴨,那不得不提醒一句,還有快手在后。

9月,快手在短視頻評(píng)論開(kāi)始內(nèi)測(cè)“快手AI玩評(píng)”,而據(jù)官方介紹,快手“AI玩評(píng)”依托于快手自研文生圖大模型“可圖”(Kolors)強(qiáng)大的圖像生成能力,用戶可以通過(guò)輸入各種創(chuàng)意文字,一鍵生成海量風(fēng)格圖片,可以更輕松、便捷地在評(píng)論區(qū)進(jìn)行趣味互動(dòng)。

不過(guò),目前在各大社交媒體平臺(tái)關(guān)于“可圖”的討論還較少。

為何圖片生成類應(yīng)用更易出圈?

回溯近幾年來(lái),國(guó)內(nèi) AIGC真正意義上破圈的現(xiàn)象級(jí)產(chǎn)品似乎大多都誕生在圖片這條賽道。

“AI對(duì)話類的也玩過(guò),但總覺(jué)得對(duì)話很傻,也并不如想象中有趣。但是像妙鴨、AI擴(kuò)圖我都用過(guò),確實(shí)會(huì)經(jīng)常收到意料之外的圖片啊,不管是離譜的還是效果不錯(cuò)的,在社交平臺(tái)發(fā)出來(lái)的討論度都還不錯(cuò)?!?0歲的桃子常年刷社交平臺(tái),對(duì)一切新鮮事物都很好奇,但相較于ChatGPT這一類的對(duì)話式AI,她更樂(lè)于嘗試圖片類應(yīng)用。

“圖像相關(guān)的應(yīng)用軟件確實(shí)更容易被用戶接受和使用,因?yàn)樵趹?yīng)用層面,人們對(duì)圖像ai功能的要求偏工具化,用戶對(duì)ai的預(yù)期是很明確的?!?祁隋是國(guó)內(nèi)一科技企業(yè)的算法工程師,他告訴鋅刻度,圖片類應(yīng)用更容易出圈還有技術(shù)方面的原因,“從全球來(lái)看,近10年的AI浪潮是從2012年的一場(chǎng)名為ImageNet的圖像識(shí)別比賽中萌芽,所以AI模型結(jié)構(gòu)也更適合在圖像上應(yīng)用,效果和效率都比文字更好,而在文字上的應(yīng)用一直到2018年 Transformer結(jié)構(gòu)被發(fā)明出來(lái)后,才算勉強(qiáng)勢(shì)均力敵,應(yīng)用領(lǐng)域離C端也相對(duì)較遠(yuǎn),直到最近找到了生成式AI這個(gè)突破口,被大眾所熟知?!?/p>

而在中國(guó),文字內(nèi)容生成比圖像內(nèi)容生成的難度也更大,“因?yàn)槲谋居?xùn)練需要大量高質(zhì)量的數(shù)據(jù),中文數(shù)據(jù)從質(zhì)和量上肯定都比英文數(shù)據(jù)更有挑戰(zhàn)性。尤其是對(duì)話式AI是開(kāi)放式的,任務(wù)也更為多元,對(duì)于數(shù)據(jù)質(zhì)量和數(shù)量的需求更是躍升了一個(gè)量級(jí)?!?祁隋稱。

不過(guò),在祁隋看來(lái),未來(lái)AI的發(fā)展方向是圖像+文本的多模態(tài)大模型?!?6氪”此前也曾提到,想要更接近通用人工智能,提高 AI 對(duì)圖像、語(yǔ)音、視頻等多模態(tài)內(nèi)容的理解不可或缺。相較于注重文本交互的單模態(tài)語(yǔ)言模型,多模態(tài)模型能將 AI 領(lǐng)域拓展至識(shí)別、檢測(cè)等更廣泛的領(lǐng)域。

那么,下一個(gè)引發(fā)現(xiàn)象級(jí)關(guān)注的AI應(yīng)用又會(huì)是什么呢?

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。