正在閱讀:

風口上的AI繪畫:藝術,還是生意?

掃一掃下載界面新聞APP

風口上的AI繪畫:藝術,還是生意?

尚不足以搶設計師飯碗。

文|真故研究室 鄭思芳

編輯|龔 正

輸入一句話,AI就能為有志于從事藝術創(chuàng)作的任何人,生成一幅創(chuàng)意畫作,不管創(chuàng)作者此前是否接受過專業(yè)的藝術訓練。

近兩年,海外用戶借助Disco Diffusion、MidJourney等AI繪畫軟件來進行藝術創(chuàng)作,逐漸成為一種風潮。在國內,也有了諸如百度文心一格、TIAMAT等這類適用于中文描述語輸入、更能理解中國文化審美的AI藝術和創(chuàng)意輔助平臺誕生。

對專業(yè)者而言,這類AI繪畫輔助工具是一個很好的創(chuàng)意助手。而一些素人則利用這些工具,發(fā)展出了自己的斜桿事業(yè),在抖音上做壁紙?zhí)?,在閑魚上賣描述語,有的還將自己的作品賣給了包裝廠或數字藏品業(yè)者,賺到些許零花錢。

01 AI式創(chuàng)作自由

吳先生本職工作是一位醫(yī)生,他愛玩抖音,閑暇之時常想著在抖音上做點什么來掙錢。

2個月前,他看到不少創(chuàng)作者在抖音上做壁紙?zhí)?,也就是?chuàng)作者會發(fā)布一些好看的照片或圖片,用戶可以下載拿去當電腦或手機桌面。下載時用戶需要看一段平臺廣告,創(chuàng)作者則能從廣告播放中獲得平臺分成。

據吳先生的觀察,壁紙?zhí)柸θ詫傩”?,但圈中也?、30萬粉絲的創(chuàng)作者,通過向用戶輸送風景、人物、汽車等這類美照,月入上萬。

吳先生本身是風景照愛好者,也想做一個風景類的壁紙?zhí)?,但苦于沒有多少素材。正發(fā)愁時,他接觸到了AI繪畫,發(fā)現只需要在AI繪畫軟件里輸入相關描述語,就能生成好看的圖片,這解決了他素材缺乏的難題。

吳先生下載了兩款海外的AI繪畫產品,一款是Disco Diffusion,一款是MidJourney,在抖音上注冊了一個賬號,名為“AI美圖”,便開始作畫。

Disco Diffusion每天有3小時可免費使用,MidJourney吳先生則充了會員費,每月30美元。每張圖平均幾分鐘就能生成的創(chuàng)作效率,足以支撐起吳先生做賬號的素材需要。

在吳先生看來,這兩款軟件擅長的重點各有不同。Disco Diffusion擅長畫場景,MidJourney擅長畫人物或動物之類的近景。

圖 | 吳先生創(chuàng)作的作品,描述語有夢月(Dream moon)、銀河(Milky Way)、夜空下的空中花園(hanging garden under night sky)、魔力(magic)、光(light),此圖已獲創(chuàng)作者授權發(fā)布。

在有了這兩款軟件的加持后,身為醫(yī)生的吳先生實現了創(chuàng)作自由。

他通過輸入各種描述語,來不斷試錯,一天能夠發(fā)布7到8張作品。雖然后來吳先生發(fā)現,因為用戶圈子太小,并不需要每日在抖音上傳這么多。

更難能可貴的是,雖然沒有藝術積淀,但并不妨礙吳先生創(chuàng)作出可賣出價格的作品。

據介紹,吳先生創(chuàng)作的一幅賽博朋克機器人,其背后的描述語,被一位從事數字藏品交易的人士以數十元價格買去,這讓吳先生驚訝不已。

爾后,這位人士又請吳先生創(chuàng)作了一組十二生肖圖片,用作數字藏品開發(fā)。吳先生用AI為每組生肖創(chuàng)作了3張圖片備選,最后這一組圖片背后的描述語,以數百元的價格售出。

這給了吳先生以啟發(fā)。由于吳先生的抖音號粉絲才200多人,難以通過廣告分成的方式掙到錢,他索性決定專門去賣描述語。

百條描述語標價20元,拿到抖音、閑魚上去賣,有印刷商前來購買,這形成了吳先生的零花錢收入。

與吳先生經歷類似的還有小紅書博主土味牛仔,攝影專業(yè)出身的他,今年6月起開始嘗試用MidJourney來進行AI繪畫。

土味牛仔的AI繪畫作品多以牛仔為主題,風格涵蓋東方元素、未來感、科幻感等,點贊量高的達數千,他習慣把攝影時無法實現的腦洞告訴AI,讓AI幫他實現。

圖 | 土味牛仔創(chuàng)作的牛仔,已獲創(chuàng)作者授權發(fā)布。

4個月的時間里,土味牛仔一共在小紅書發(fā)布了117張AI繪畫作品,其中每張作品背后平均的生成次數為50次,可謂精益求精。

創(chuàng)作者在學習,AI也在學習。目前,MidJourney里共記錄了土味牛仔的10000多次生成記錄。現在土味牛仔只要一輸入相關詞匯,AI就能生成相關額外的聯想。有時土味牛仔會懷念“不太聽人話”、更具備天馬行空創(chuàng)意的AI,而不是對人類思維偏好越來越貼近的圓滑AI。

在小紅書上發(fā)布AI繪畫作品以后,土味牛仔說他接到過幾次約稿,也有人找上門想直接購買原圖留作NFT收藏,但這樣的人屈指可數。目前他在AI繪畫作品上的收入還不足以支付他在MidJourney上的投入。

據土味牛仔在圈子里的觀察,大家使用AI繪畫的原因各不相同。有插畫師朋友會用AI生成作品的草稿,以此為基礎進行創(chuàng)意和修改。做建筑設計的朋友則會利用AI來進行頭腦風暴。但更多素人就是圖一個新鮮,就是想要看“超人跟鋼鐵俠合在一起是什么樣子”。

在用戶們的推動下,B站、抖音上等介紹AI繪畫軟件和教程的視頻越來越多,小紅書則成了AI繪畫作品的一個重要展示平臺,閑魚則扮演了一個銷售描述語的平臺角色。

02 AI繪畫技術的迭代

AI繪畫的源頭可以追溯到上世紀70年代。

計算機問世后的10年,就有藝術家打造電腦程序AARON來進行繪畫創(chuàng)作,其主要原理是控制機械臂來作畫,但當時的技術成本比較高,且只能得到抽象的結果。

圖 | AARON和它的發(fā)明者Harold Cohen

而現代意義的AI繪畫,主要是指AI從海量圖文對應的數據中學習“語言描述”與“藝術畫面”的關聯,以隨機化的起點開始,不斷修正畫作,最終形成在審美上與人類經驗與知識高度一致的成品。

據百度文心一格相關負責人介紹,現代意義AI繪畫技術的雛形,主要出現在上一個十年中。

彼時的技術可以批量完成由文本信息指定的畫面生成,技術上包括風格遷移、元素拼接和對抗生成網絡(GAN—Generative Adverserial Network)等。

從生成的畫面質量來看,雖然這些技術使AI繪畫的水平有了明顯進展,并且在比較強烈的風格上有了初步的應用可能性,但與人類作畫質量依然存在差距。

AI繪畫最近的一次技術爆發(fā)是2022年對擴散生成模型的引入,這類模型用于文生圖后,能夠在更短的時間內,像素級建模并生成分辨率顯著提升的繪畫,并且在美感、細節(jié)精細度有非常顯著的提升,一些AI繪畫的成品已經和人類作畫的質量不相上下。

行業(yè)里普遍認為,從2021年到2022年,是AI文生圖技術發(fā)展最快的兩年,諸多新的學習模型或產品誕生,AI繪畫的風潮也開始發(fā)展。

一是Open AI于2021年初發(fā)布的深度學習模型 CLIP(Contrastive Language-Image Pre-Training)。

Open AI是一家于2015年12月成立于美國的人工智能研究公司,它用 CLIP先后創(chuàng)建了DALL-E 和DALL·E 2兩個AI系統,為用戶構建了可以根據文字描述創(chuàng)建更逼真、更準確圖像的能力。

二是于今年2月初開始出現并流行的開源繪畫程序Disco Diffusion,它是一個由谷歌推出的AI,開發(fā)者是藝術家兼程序開發(fā)員的Somnai_dreams 。

Disco Diffusion的特點是能夠高效合成視覺數據,圖片生成的質量直接擊敗了GAN模型。但缺陷仍然存在,主要表現在AI繪畫欠缺細節(jié),渲染的時間過長,內存資源消耗巨大。今年7月開始測試的Stable Diffusion程序,則很快改進了以上缺點。

三是今年6月推出的MidJourney,它是一個富有創(chuàng)造性的AI,用它生成的圖片質量得到了大幅度的提升,且以月費為方式的商業(yè)化做得比較成功。目前公開資料顯示MidJourney的用戶成員已經超過了240萬人。

圖 | MidJourney社區(qū)上的展示畫作

在國內,AI繪畫也開始逐漸有了熱度。

像Stable Diffusion、MidJourney這類模型,主要是針對英文世界的用戶,語言和文化的差異形成了國內用戶使用海外AI繪畫軟件的阻礙。國內用戶呼喚中文世界的文生圖產品,這形成了一定的市場需求。

TIAMAT成立于2021年、被稱為是國內首批AI生成式平臺。今年上半年,TIAMAT開始在小紅書、抖音等社交媒體上發(fā)布中文文生圖的產品,趕上了AI繪畫的第一波熱潮。

圖 | 小紅書上的AI繪畫

圖 | 閑魚上的AI繪畫

TIAMAT致力于為個人用戶和企業(yè)客戶提供創(chuàng)意生產、廣告、數字藏品等場景形式下的服務。日前,TIAMAT已宣布完成數百萬美元天使輪融資,投資方為DCM。

今年8月,百度發(fā)布了AI藝術和創(chuàng)意輔助平臺文心一格,它使用了百度自主研發(fā)的產業(yè)級知識增強大模型—文心大模型,通過語義理解+多畫作風格適配+結果優(yōu)化排序,讓用戶只需要輸入一句話,就能完成畫作,包括意向、具象等多種類型和風格。

文心一格被認為有效地解決了中文世界中,需求描述困難、多樣化需求強、模型生成結果篩選難的困難,降低了中文世界用戶使用AI繪畫的難度。

基于文心一格平臺,由百度數字人度曉曉創(chuàng)作的“無界”系列畫作,已被專業(yè)美院教授評價為“已經達到了本科美術生的基本要求”。

圖 | 度曉曉創(chuàng)作的無界系列

業(yè)內人士指出,對于AI繪畫而言,如何讓AI準確理解中英文語境中的描述語至關重要。描述語不僅有中英文上的語言差異,也有語言承載的文化差異,從而影響到AI繪畫技術的研發(fā)。

例如“龍”對于英文環(huán)境基本沒有歧義,但在中文環(huán)境中則有東方龍和西方龍的形象差異,且東方龍和西方龍作為文化符號的意義也完全不同,這對AI繪畫技術提出了很大的挑戰(zhàn)。

從當下來看,如何處理好語言、文化的差異,AI繪畫還有很長的路要走。

03 AI繪畫的爭議點和未來發(fā)展

AI繪畫誕生后,市場上存在的一個爭議點主要圍繞版權展開。

AI繪畫平臺的底層邏輯是融合各創(chuàng)作者的作品以及現有的互聯網圖片生成的作品,提取原作的筆觸、用色、構圖等元素而進行的“二次創(chuàng)作”,至于版權是歸原作者、平臺方,還是現在的創(chuàng)作者,目前尚難以界定。

據使用過Disco Diffusion和MidJourney的用戶介紹,用Disco Diffusion生成的圖片版權屬于創(chuàng)作者自己所有,而使用MidJourney生成的圖片版權則屬于創(chuàng)作者與平臺共有。

百度文心一格相關負責人認為,AI技術生成的圖片并不是既有圖片的拼湊,而是類似人類經過長期繪畫訓練后的再創(chuàng)作,既有繼承,也有自己的特色。

不過基于版權問題,行業(yè)仍在討論中,為了避免可能的風險以及解決可能發(fā)生的糾紛,百度文心一格方面就表示,未來如果平臺開放出來的生成圖片侵犯到原作者權益,會提供投訴反饋通道,為相關權利人提供權利救濟渠道,迅速處理。

據了解,目前國內還無相關具體的法律案例能夠用來作參考。

圖 | 在文心一格中輸入“人工智能畫面、超現實主義”生成的圖片

關于AI繪畫的發(fā)展方向,本質是AIGC(人工智能自主生成內容)技術的發(fā)展,它是一種繼PGC、UGC之后全新的內容生產方式,被認為能夠刺激內容產業(yè)進一步發(fā)展。

公開數據顯示,全球庫存圖片市場規(guī)模接近3000億美元。但目前主流的圖片市場是平臺有什么用戶用什么,而不是用戶想要什么就有什么。內容生產者仍然受限于生產的想象力,傳統圖片行業(yè)還處于“數字手工業(yè)”階段。

相較之下,AIGC的發(fā)展正好順應了內容創(chuàng)作者對生產想象力的延伸。以前AI只是輔助內容創(chuàng)作的工具,現在AI已經能夠獨立完成寫作、設計、繪畫、作曲等創(chuàng)意性工作。

這里需要注意的一點是,AIGC 聽上去時髦,但自動化內容生成并不是一個很新的概念。

利用計算機輔助人類進行內容生產早已經出現,比如在計算機編程領域 IDE 的代碼提示、使用 Office Word 編輯內容的錯誤修正,再到后來利用 NLG 自動化文本生成等都可以算在這個范圍里。

關于目前的AIGC技術處于哪個發(fā)展階段, 百度CEO李彥宏在2022年百度世界大會上有一個論述。

他將AIGC分為三個發(fā)展階段:第一階段是助手階段,AIGC 輔助人類進行內容生產;第二階段是協作階段,AIGC 以虛實并存的虛擬人形態(tài)出現,形成人機共生的局面;第三階段是原創(chuàng)階段,AIGC 將獨立完成內容創(chuàng)作。

從目前AI在作文、繪畫、寫歌等各個領域的發(fā)展來看,AIGC已經進入助手階段,但總體處于發(fā)展早期。

未來AI作畫是否會取代設計師、原畫師等,這個還說不定。但從目前人們的反應來看,人們顯然還沒有那么憂慮。

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

風口上的AI繪畫:藝術,還是生意?

尚不足以搶設計師飯碗。

文|真故研究室 鄭思芳

編輯|龔 正

輸入一句話,AI就能為有志于從事藝術創(chuàng)作的任何人,生成一幅創(chuàng)意畫作,不管創(chuàng)作者此前是否接受過專業(yè)的藝術訓練。

近兩年,海外用戶借助Disco Diffusion、MidJourney等AI繪畫軟件來進行藝術創(chuàng)作,逐漸成為一種風潮。在國內,也有了諸如百度文心一格、TIAMAT等這類適用于中文描述語輸入、更能理解中國文化審美的AI藝術和創(chuàng)意輔助平臺誕生。

對專業(yè)者而言,這類AI繪畫輔助工具是一個很好的創(chuàng)意助手。而一些素人則利用這些工具,發(fā)展出了自己的斜桿事業(yè),在抖音上做壁紙?zhí)?,在閑魚上賣描述語,有的還將自己的作品賣給了包裝廠或數字藏品業(yè)者,賺到些許零花錢。

01 AI式創(chuàng)作自由

吳先生本職工作是一位醫(yī)生,他愛玩抖音,閑暇之時常想著在抖音上做點什么來掙錢。

2個月前,他看到不少創(chuàng)作者在抖音上做壁紙?zhí)?,也就是?chuàng)作者會發(fā)布一些好看的照片或圖片,用戶可以下載拿去當電腦或手機桌面。下載時用戶需要看一段平臺廣告,創(chuàng)作者則能從廣告播放中獲得平臺分成。

據吳先生的觀察,壁紙?zhí)柸θ詫傩”?,但圈中也?、30萬粉絲的創(chuàng)作者,通過向用戶輸送風景、人物、汽車等這類美照,月入上萬。

吳先生本身是風景照愛好者,也想做一個風景類的壁紙?zhí)?,但苦于沒有多少素材。正發(fā)愁時,他接觸到了AI繪畫,發(fā)現只需要在AI繪畫軟件里輸入相關描述語,就能生成好看的圖片,這解決了他素材缺乏的難題。

吳先生下載了兩款海外的AI繪畫產品,一款是Disco Diffusion,一款是MidJourney,在抖音上注冊了一個賬號,名為“AI美圖”,便開始作畫。

Disco Diffusion每天有3小時可免費使用,MidJourney吳先生則充了會員費,每月30美元。每張圖平均幾分鐘就能生成的創(chuàng)作效率,足以支撐起吳先生做賬號的素材需要。

在吳先生看來,這兩款軟件擅長的重點各有不同。Disco Diffusion擅長畫場景,MidJourney擅長畫人物或動物之類的近景。

圖 | 吳先生創(chuàng)作的作品,描述語有夢月(Dream moon)、銀河(Milky Way)、夜空下的空中花園(hanging garden under night sky)、魔力(magic)、光(light),此圖已獲創(chuàng)作者授權發(fā)布。

在有了這兩款軟件的加持后,身為醫(yī)生的吳先生實現了創(chuàng)作自由。

他通過輸入各種描述語,來不斷試錯,一天能夠發(fā)布7到8張作品。雖然后來吳先生發(fā)現,因為用戶圈子太小,并不需要每日在抖音上傳這么多。

更難能可貴的是,雖然沒有藝術積淀,但并不妨礙吳先生創(chuàng)作出可賣出價格的作品。

據介紹,吳先生創(chuàng)作的一幅賽博朋克機器人,其背后的描述語,被一位從事數字藏品交易的人士以數十元價格買去,這讓吳先生驚訝不已。

爾后,這位人士又請吳先生創(chuàng)作了一組十二生肖圖片,用作數字藏品開發(fā)。吳先生用AI為每組生肖創(chuàng)作了3張圖片備選,最后這一組圖片背后的描述語,以數百元的價格售出。

這給了吳先生以啟發(fā)。由于吳先生的抖音號粉絲才200多人,難以通過廣告分成的方式掙到錢,他索性決定專門去賣描述語。

百條描述語標價20元,拿到抖音、閑魚上去賣,有印刷商前來購買,這形成了吳先生的零花錢收入。

與吳先生經歷類似的還有小紅書博主土味牛仔,攝影專業(yè)出身的他,今年6月起開始嘗試用MidJourney來進行AI繪畫。

土味牛仔的AI繪畫作品多以牛仔為主題,風格涵蓋東方元素、未來感、科幻感等,點贊量高的達數千,他習慣把攝影時無法實現的腦洞告訴AI,讓AI幫他實現。

圖 | 土味牛仔創(chuàng)作的牛仔,已獲創(chuàng)作者授權發(fā)布。

4個月的時間里,土味牛仔一共在小紅書發(fā)布了117張AI繪畫作品,其中每張作品背后平均的生成次數為50次,可謂精益求精。

創(chuàng)作者在學習,AI也在學習。目前,MidJourney里共記錄了土味牛仔的10000多次生成記錄?,F在土味牛仔只要一輸入相關詞匯,AI就能生成相關額外的聯想。有時土味牛仔會懷念“不太聽人話”、更具備天馬行空創(chuàng)意的AI,而不是對人類思維偏好越來越貼近的圓滑AI。

在小紅書上發(fā)布AI繪畫作品以后,土味牛仔說他接到過幾次約稿,也有人找上門想直接購買原圖留作NFT收藏,但這樣的人屈指可數。目前他在AI繪畫作品上的收入還不足以支付他在MidJourney上的投入。

據土味牛仔在圈子里的觀察,大家使用AI繪畫的原因各不相同。有插畫師朋友會用AI生成作品的草稿,以此為基礎進行創(chuàng)意和修改。做建筑設計的朋友則會利用AI來進行頭腦風暴。但更多素人就是圖一個新鮮,就是想要看“超人跟鋼鐵俠合在一起是什么樣子”。

在用戶們的推動下,B站、抖音上等介紹AI繪畫軟件和教程的視頻越來越多,小紅書則成了AI繪畫作品的一個重要展示平臺,閑魚則扮演了一個銷售描述語的平臺角色。

02 AI繪畫技術的迭代

AI繪畫的源頭可以追溯到上世紀70年代。

計算機問世后的10年,就有藝術家打造電腦程序AARON來進行繪畫創(chuàng)作,其主要原理是控制機械臂來作畫,但當時的技術成本比較高,且只能得到抽象的結果。

圖 | AARON和它的發(fā)明者Harold Cohen

而現代意義的AI繪畫,主要是指AI從海量圖文對應的數據中學習“語言描述”與“藝術畫面”的關聯,以隨機化的起點開始,不斷修正畫作,最終形成在審美上與人類經驗與知識高度一致的成品。

據百度文心一格相關負責人介紹,現代意義AI繪畫技術的雛形,主要出現在上一個十年中。

彼時的技術可以批量完成由文本信息指定的畫面生成,技術上包括風格遷移、元素拼接和對抗生成網絡(GAN—Generative Adverserial Network)等。

從生成的畫面質量來看,雖然這些技術使AI繪畫的水平有了明顯進展,并且在比較強烈的風格上有了初步的應用可能性,但與人類作畫質量依然存在差距。

AI繪畫最近的一次技術爆發(fā)是2022年對擴散生成模型的引入,這類模型用于文生圖后,能夠在更短的時間內,像素級建模并生成分辨率顯著提升的繪畫,并且在美感、細節(jié)精細度有非常顯著的提升,一些AI繪畫的成品已經和人類作畫的質量不相上下。

行業(yè)里普遍認為,從2021年到2022年,是AI文生圖技術發(fā)展最快的兩年,諸多新的學習模型或產品誕生,AI繪畫的風潮也開始發(fā)展。

一是Open AI于2021年初發(fā)布的深度學習模型 CLIP(Contrastive Language-Image Pre-Training)。

Open AI是一家于2015年12月成立于美國的人工智能研究公司,它用 CLIP先后創(chuàng)建了DALL-E 和DALL·E 2兩個AI系統,為用戶構建了可以根據文字描述創(chuàng)建更逼真、更準確圖像的能力。

二是于今年2月初開始出現并流行的開源繪畫程序Disco Diffusion,它是一個由谷歌推出的AI,開發(fā)者是藝術家兼程序開發(fā)員的Somnai_dreams 。

Disco Diffusion的特點是能夠高效合成視覺數據,圖片生成的質量直接擊敗了GAN模型。但缺陷仍然存在,主要表現在AI繪畫欠缺細節(jié),渲染的時間過長,內存資源消耗巨大。今年7月開始測試的Stable Diffusion程序,則很快改進了以上缺點。

三是今年6月推出的MidJourney,它是一個富有創(chuàng)造性的AI,用它生成的圖片質量得到了大幅度的提升,且以月費為方式的商業(yè)化做得比較成功。目前公開資料顯示MidJourney的用戶成員已經超過了240萬人。

圖 | MidJourney社區(qū)上的展示畫作

在國內,AI繪畫也開始逐漸有了熱度。

像Stable Diffusion、MidJourney這類模型,主要是針對英文世界的用戶,語言和文化的差異形成了國內用戶使用海外AI繪畫軟件的阻礙。國內用戶呼喚中文世界的文生圖產品,這形成了一定的市場需求。

TIAMAT成立于2021年、被稱為是國內首批AI生成式平臺。今年上半年,TIAMAT開始在小紅書、抖音等社交媒體上發(fā)布中文文生圖的產品,趕上了AI繪畫的第一波熱潮。

圖 | 小紅書上的AI繪畫

圖 | 閑魚上的AI繪畫

TIAMAT致力于為個人用戶和企業(yè)客戶提供創(chuàng)意生產、廣告、數字藏品等場景形式下的服務。日前,TIAMAT已宣布完成數百萬美元天使輪融資,投資方為DCM。

今年8月,百度發(fā)布了AI藝術和創(chuàng)意輔助平臺文心一格,它使用了百度自主研發(fā)的產業(yè)級知識增強大模型—文心大模型,通過語義理解+多畫作風格適配+結果優(yōu)化排序,讓用戶只需要輸入一句話,就能完成畫作,包括意向、具象等多種類型和風格。

文心一格被認為有效地解決了中文世界中,需求描述困難、多樣化需求強、模型生成結果篩選難的困難,降低了中文世界用戶使用AI繪畫的難度。

基于文心一格平臺,由百度數字人度曉曉創(chuàng)作的“無界”系列畫作,已被專業(yè)美院教授評價為“已經達到了本科美術生的基本要求”。

圖 | 度曉曉創(chuàng)作的無界系列

業(yè)內人士指出,對于AI繪畫而言,如何讓AI準確理解中英文語境中的描述語至關重要。描述語不僅有中英文上的語言差異,也有語言承載的文化差異,從而影響到AI繪畫技術的研發(fā)。

例如“龍”對于英文環(huán)境基本沒有歧義,但在中文環(huán)境中則有東方龍和西方龍的形象差異,且東方龍和西方龍作為文化符號的意義也完全不同,這對AI繪畫技術提出了很大的挑戰(zhàn)。

從當下來看,如何處理好語言、文化的差異,AI繪畫還有很長的路要走。

03 AI繪畫的爭議點和未來發(fā)展

AI繪畫誕生后,市場上存在的一個爭議點主要圍繞版權展開。

AI繪畫平臺的底層邏輯是融合各創(chuàng)作者的作品以及現有的互聯網圖片生成的作品,提取原作的筆觸、用色、構圖等元素而進行的“二次創(chuàng)作”,至于版權是歸原作者、平臺方,還是現在的創(chuàng)作者,目前尚難以界定。

據使用過Disco Diffusion和MidJourney的用戶介紹,用Disco Diffusion生成的圖片版權屬于創(chuàng)作者自己所有,而使用MidJourney生成的圖片版權則屬于創(chuàng)作者與平臺共有。

百度文心一格相關負責人認為,AI技術生成的圖片并不是既有圖片的拼湊,而是類似人類經過長期繪畫訓練后的再創(chuàng)作,既有繼承,也有自己的特色。

不過基于版權問題,行業(yè)仍在討論中,為了避免可能的風險以及解決可能發(fā)生的糾紛,百度文心一格方面就表示,未來如果平臺開放出來的生成圖片侵犯到原作者權益,會提供投訴反饋通道,為相關權利人提供權利救濟渠道,迅速處理。

據了解,目前國內還無相關具體的法律案例能夠用來作參考。

圖 | 在文心一格中輸入“人工智能畫面、超現實主義”生成的圖片

關于AI繪畫的發(fā)展方向,本質是AIGC(人工智能自主生成內容)技術的發(fā)展,它是一種繼PGC、UGC之后全新的內容生產方式,被認為能夠刺激內容產業(yè)進一步發(fā)展。

公開數據顯示,全球庫存圖片市場規(guī)模接近3000億美元。但目前主流的圖片市場是平臺有什么用戶用什么,而不是用戶想要什么就有什么。內容生產者仍然受限于生產的想象力,傳統圖片行業(yè)還處于“數字手工業(yè)”階段。

相較之下,AIGC的發(fā)展正好順應了內容創(chuàng)作者對生產想象力的延伸。以前AI只是輔助內容創(chuàng)作的工具,現在AI已經能夠獨立完成寫作、設計、繪畫、作曲等創(chuàng)意性工作。

這里需要注意的一點是,AIGC 聽上去時髦,但自動化內容生成并不是一個很新的概念。

利用計算機輔助人類進行內容生產早已經出現,比如在計算機編程領域 IDE 的代碼提示、使用 Office Word 編輯內容的錯誤修正,再到后來利用 NLG 自動化文本生成等都可以算在這個范圍里。

關于目前的AIGC技術處于哪個發(fā)展階段, 百度CEO李彥宏在2022年百度世界大會上有一個論述。

他將AIGC分為三個發(fā)展階段:第一階段是助手階段,AIGC 輔助人類進行內容生產;第二階段是協作階段,AIGC 以虛實并存的虛擬人形態(tài)出現,形成人機共生的局面;第三階段是原創(chuàng)階段,AIGC 將獨立完成內容創(chuàng)作。

從目前AI在作文、繪畫、寫歌等各個領域的發(fā)展來看,AIGC已經進入助手階段,但總體處于發(fā)展早期。

未來AI作畫是否會取代設計師、原畫師等,這個還說不定。但從目前人們的反應來看,人們顯然還沒有那么憂慮。

本文為轉載內容,授權事宜請聯系原著作權人。