正在閱讀:

AI作畫的人機戰(zhàn)爭走向何方?

掃一掃下載界面新聞APP

AI作畫的人機戰(zhàn)爭走向何方?

對AI作畫的聲討,卻在近幾個月來,在社交媒體中發(fā)展到了一個高峰。

文|腦極體

AI對于人類職業(yè)的影響及其引發(fā)的輿論波瀾,迅猛到讓人難以想象。還記得2017年,AI還是個標準的新生事物,我們的核心工作之一就是向讀者們解釋,同聲傳譯、漫畫作家、主持人等人類工作短期內(nèi)仍是無法被AI取代的。而到了今年,一場因AI作畫而引發(fā)的人類畫家危機大討論卻在國內(nèi)外社交媒體上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……這些從文本生成圖像的AI作畫工具大量出現(xiàn),越來越受歡迎,市面上由AI生成的畫作越來越多,不斷刷新著大眾對AI能力邊界的認知,大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮,噴涌而出。

在AIGC的激變時刻,關(guān)于AI作畫的法律、倫理等問題也變得愈發(fā)重要,這場人機戰(zhàn)爭究竟走向何方?我們嘗試用一文說清整個事件的起承轉(zhuǎn)合。

起:引發(fā)眾怒的科技與狠活

AI生成的藝術(shù)畫作已經(jīng)存在了很長時間,2017年,AI繪畫就成為佳士得、蘇富比等高端拍賣場所的座上賓,拍出過數(shù)百萬美元的高價,除了引發(fā)行業(yè)內(nèi)人士的一些分析和唏噓之外,大眾輿論場并沒有掀起什么波瀾。

然而,對AI作畫的聲討,卻在近幾個月來,在社交媒體中發(fā)展到了一個高峰。

其一,大量畫師宣布抵制AI。今年8月29日,一個名叫mimic的AI繪畫網(wǎng)站上線了測試版,允許用戶上傳15至100張圖像讓AI進行學習,然后輸出相同畫風的AI畫作。然而一些未經(jīng)授權(quán)的畫作也被上傳學習,把AI生成的畫作當做自己的創(chuàng)作進行售賣。隨后又出現(xiàn)了有人將剛剛?cè)ナ赖漠嫾疑性诎鏅?quán)保護期間的作品上傳給AI學習,這些動作相繼引發(fā)了大批原創(chuàng)作者的不滿,從而抵制“AI學習”。

其二,輿論危機波及幾乎所有主流AI繪圖工具。mimic事件直接激發(fā)了大量畫師和讀者對AI的不滿情緒,有人刪除了自己的公開畫作,有人開始訴諸法律條文,一時間針對數(shù)據(jù)版權(quán)、技術(shù)倫理等的爭議,也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發(fā)現(xiàn),一些很火的工具如NovelAI,訓練學習所使用的數(shù)據(jù)來源網(wǎng)站也存在上傳無授權(quán)圖片的情況。

網(wǎng)站Danbooru發(fā)布的聲明顯示,像NovelAI這樣的生成器是在數(shù)千個網(wǎng)站的數(shù)十億張圖片上進行訓練的,包括Pixiv、Twitter、DeviantArt和Tumblr等藝術(shù)家網(wǎng)站,以及Reddit、Pinterest等網(wǎng)站,所以從Danbooru平臺上刪除作品并不會阻止AI繼續(xù)使用畫家在其他網(wǎng)站的作品。也就是說,只要是網(wǎng)絡(luò)上開放的,就有可能成為學習數(shù)據(jù),除了詢問模型的開發(fā)者之外,沒有其他方法可以阻止自己的作品被AI學習,除非畫家把自己的畫全網(wǎng)都刪完,否則也很難一一查清楚是否被用來學習了。

其三,個人使用AI作畫出現(xiàn)了大量爭議現(xiàn)象。隨著開發(fā)門檻的降低,大量個人AI開發(fā)者使用開源工具也出現(xiàn)了大量意料之外的情況,比如有人使用AI生成yhsq等違規(guī)內(nèi)容。9月6日,用AI繪圖工具Midjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會藝術(shù)比賽上獲得數(shù)字類別中的頭獎,也引發(fā)了不小的爭議,因為作者所付出的勞動就是輸入描述文字,AI就會將畫作按需求創(chuàng)作出來,被網(wǎng)友認為是“見證了藝術(shù)的死亡”“沒有意義,沒有靈魂”,藝術(shù)家Genel Jumalon更直言,“用一幅AI畫作在藝術(shù)領(lǐng)域獲得一等獎,真是該死的事”。

擔心AI取代人類畫師,將AI作畫視為對人類能力的貶低,成為一種正在傳染的情緒。

如前所說,AI生成繪畫并不是什么新鮮事物,為什么偏偏近期突然在大眾群體中掀起了水花,引發(fā)眾怒?人當然不是只靠最后一根稻草壓垮的。

承接:AI作畫的內(nèi)卷之路

有必要先來簡單了解一下,AI作畫是如何在幾年間從拍賣行、收藏家們關(guān)注的小眾藝術(shù),成長為大眾創(chuàng)作的主流標配。

計算機視覺一直是深度學習的主要任務(wù)方向之一,包括目標識別、目標跟蹤、圖像分割、圖形處理等,有著大量成熟且廣泛的應(yīng)用。具體到圖像生成領(lǐng)域,2015年左右,AI藝術(shù)創(chuàng)作主要是通過基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學習,來進行圖像風格轉(zhuǎn)換,先對圖像內(nèi)容進行語義分割,再將內(nèi)容和場景通過線條彎曲、風格遷移等手法,轉(zhuǎn)換成指定藝術(shù)風格,類似美顏軟件的“濾鏡”功能。顯然,這種生成方法的藝術(shù)價值并不高,能一鍵p圖的人也并不因此就自認是大藝術(shù)家,而且經(jīng)常出現(xiàn)很鬼畜的作品,谷歌深度學習繪畫系統(tǒng)DeepDream加工過的圖片就十分詭異。

AI生成真正開始展現(xiàn)出藝術(shù)價值和媲美人類的水平,是從2016年生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Nets)的走紅開始的,GAN模型的原理就是讓生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)相互對抗,從而創(chuàng)作出真實度和準確度都更高的全新圖像。這一時期,各種XXGAN的圖像生成器出現(xiàn),誕生了大量“以假亂真”的藝術(shù)作品。2018年10月佳士得以43.25 萬美元的價格拍賣了由AI創(chuàng)作的《愛德蒙·貝拉米肖像》,成為人類歷史上首次AI藝術(shù)品拍賣。

但是,GAN也不能擺脫傳統(tǒng)AI深度模型的問題:無法理解“邏輯”和“常識”,比如AI能夠根據(jù)文本關(guān)鍵詞把元素堆疊在一起,但因為無法理解隱藏在自然語言背后的邏輯關(guān)系,所以經(jīng)常會畫出非?!翱颂K魯”的反常識作品。而改變,來自預(yù)訓練大模型的興起。

通過大規(guī)模數(shù)據(jù)和暴力計算而訓練出來的大模型,展現(xiàn)出了強大的魯棒性,不僅在機器視覺領(lǐng)域表現(xiàn)優(yōu)異,而且還不斷迭代出了跨模態(tài)生成的能力,推動AI生成從語言走向視覺。這一波 “文本轉(zhuǎn)圖像”繪畫工具能夠產(chǎn)生以假亂真的畫作,背后的“腦力”普遍來自大模型基礎(chǔ)技術(shù)的支撐。在AI繪畫工具上展開技術(shù)競賽的谷歌、OpenAI、百度等都是大模型技術(shù)的佼佼者和AIGC的推動者。

讀懂了AI作畫的技術(shù)傳承之路,也就不難理解,為什么AI創(chuàng)作的爭議會在此時此刻被發(fā)酵。

首先, 巨頭云集,技術(shù)進展超乎想象。AI作畫匯聚了大量科技巨頭“亮肌肉”,包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者,使得技術(shù)突飛猛進,工具數(shù)量以前所未有的速度爆發(fā)性增長,AI作畫(圖像生成)能力也因內(nèi)卷而達到令人震驚的水平。2021年1月,OpenAI推出了DALL-E一年后,又推出了最新的DALL·E 2,分辨率提高4倍,可以從自然語言的描述中創(chuàng)建逼真的圖像。谷歌內(nèi)部就卷出了多個AI繪圖工具,包括Imagen、Parti等,微軟推出的AI繪圖平臺則起名為NUWA女媧,足見野心不小。

大模型優(yōu)秀的生成效果,使得AI作畫具備了一定的實用性和商用潛力,包括結(jié)合文本生成插畫、創(chuàng)意工作的初樣展示、自動完成勾線等重復(fù)機械勞動等,AIGC在走向產(chǎn)業(yè)的同時自然面臨傳統(tǒng)從業(yè)者的懷疑。

其次,大模型的積極開源,讓AI作畫門檻一降再降。

這一輪主流的AI繪圖工具都選擇了開源,繁榮大模型的開發(fā)生態(tài),降低技術(shù)的使用門檻,任何人都可以使用這些工具進行創(chuàng)作,有的甚至是免費的。比如英國初創(chuàng)公司Stability AI打造的StableDIffusion就完全開放,OpenAI在9月28日開放了Dall-E 2 并提供免費試用,NovelAI在10月3號開放,都吸引了大量用戶前去使用。

相比此前AIGC只作為小眾藝術(shù)品和收藏投資對象,基于大模型的AIGC讓更多人參與到訓練、開發(fā)和使用中來。盡管各個開源社區(qū)都明確公布了知識產(chǎn)權(quán)相關(guān)規(guī)定,包括不得用于成人內(nèi)容、仇恨或暴力圖像,避免使用受版權(quán)保護的材料。但隨著用戶的增多和門檻的下降,一旦有人不了解并遵守開源社區(qū)的知識產(chǎn)權(quán)規(guī)范和協(xié)議,違規(guī)情況就難免發(fā)生。

(DALL·E 2的內(nèi)容政策)

另外,法律空白與滯后,令原創(chuàng)者對維權(quán)感到無能為力。

依靠開源社區(qū)的約束是很難避免AI濫用,那么能不能依靠數(shù)字作品的專項法規(guī)來保護原創(chuàng)者的知識產(chǎn)權(quán)呢?現(xiàn)狀顯然是令人失望的,立法作為一件非常嚴肅的事情,往往具有一定的滯后性。與飛速發(fā)展的AI技術(shù)相比,對于AI生成的作品是否具有知識產(chǎn)權(quán)/著作權(quán),利用AI生成違規(guī)圖像如何處理,相關(guān)法律法規(guī)在全球范圍內(nèi)都還在空白和討論階段,目前只有個案作為參考。2019年斯蒂芬·泰勒(Stephen Thaler)希望將他發(fā)明的DABUS人工智能系統(tǒng)命名為“發(fā)明者”,并獲得相關(guān)發(fā)明專利,但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來,在全球范圍內(nèi),知識產(chǎn)權(quán)制度更注重人類創(chuàng)造,使用AI并點擊“go”并不被認為是創(chuàng)造性行為。比如深圳市南山法院就曾判定在一起案件中,AI輔助協(xié)作系統(tǒng)生成的文章,受到著作權(quán)法保護,擅自復(fù)制傳播需要承擔相應(yīng)的民事責任。

知識產(chǎn)權(quán)本身就存在的判定難、維權(quán)難的特點,而AI生成內(nèi)容法律保護的“缺位”,更加劇了維權(quán)的難度,很難約束違規(guī)使用,這也使得人類原創(chuàng)畫師面對AI繪畫工具,其知識產(chǎn)權(quán)也處于“真空”地帶。

技術(shù)、文化、倫理與法律等各種因素交織在一起,構(gòu)成了開篇中AI作畫的種種爭議和風波的緣起,這是一個環(huán)環(huán)相扣的故事。

轉(zhuǎn)與合:創(chuàng)作者的激變與新機

那么,有爭議是不是意味著AI作畫就此停滯了呢?還真不是!

事實上,經(jīng)過頻繁的討論,大量原創(chuàng)畫師對于AI繪畫工具都有了一定的嘗試和了解,從一些知名畫師的反饋來看,對于AI作畫這樣的AIGC應(yīng)用,普遍表現(xiàn)出了三種態(tài)度。

1.AI想取代人類畫師,還早。

某博主測試過后發(fā)現(xiàn),“搞出來的能看的圖多少有一些,但符合描述意圖的圖基本可以說沒有”;“AI畫畫其實在我這個修圖師眼里其實跟ps里那個填充功能差不多”。原因在于,AIGC的內(nèi)容質(zhì)量還有提升的空間。一方面,AI大模型的自然語言理解能力與人類還有很大的差距,GPT-3所生成的文本也就相當于小學生水平,這種情況下要讓AI繪圖工具理解復(fù)雜的文本,并準確用圖像表達出內(nèi)容思想,還是有點困難的。另一方面,在商業(yè)上,藝術(shù)品市場推崇的都是極富獨特性的作品,稀缺性一直是藝術(shù)品重要的定價標準,工業(yè)化、批量產(chǎn)出的東西對收藏家來說沒有價值,隨著AI繪畫工具的開源,手工制作的獨特產(chǎn)品或許才會成為人們追求的藝術(shù)。這種趨勢其實已經(jīng)出現(xiàn)了,有網(wǎng)友就認為未來約稿很可能“純手工”“零AI”反而會成為賣點。

一位創(chuàng)作博主直言:標榜自己的圖是手工繪圖的畫師,今后想要過得富足,或許需要盡量為自己的作品附加額外的價值——這種生活方式早已有人在運營,那就是藝術(shù)家們。

所以至少目前為止,AI繪畫工具能提供很多幫助,但還是無法取代人類畫師的。

2.AI作畫,確實有點用。

需要注意的是,藝術(shù)創(chuàng)作、藝術(shù)品收藏是一種相對小眾的活動,能夠成為藝術(shù)家的是極少數(shù)極小眾的一批人。不過,日常生產(chǎn)生活中存在大量視覺和設(shè)計工作。在這些領(lǐng)域中,AI已經(jīng)能夠扮演非常有用的“作圖助理”角色,成為大勢所趨。

一種是減少重復(fù)性/風險性工作。比如視覺創(chuàng)意中,與客戶溝通耗費大量時間和精力,存在大量不確定性,經(jīng)常畫完即使版后客戶說“還是第一版好”,遇到這種讓美工自閉的情況,AI就可以扮演起一個任勞任怨的乙方,快速生成多樣化的AI創(chuàng)意圖片,避免了過重的前期投入乃至返工。另外,每逢節(jié)日大促活動,美工難免就會遇到大量重復(fù)枯燥的工作,比如制作高度同質(zhì)化的海報,也可以由高水準的AI能力來完成。因此有設(shè)計師將DALL·E命名為“傻逼甲方終結(jié)者”。

另一種是AI作為輔助工具,提高設(shè)計師的工作效率。許多基于AI繪圖工具都已經(jīng)被開發(fā)為Figma、Photoshop、Blender等工具的插件,幫助創(chuàng)作者渲染細節(jié)、一鍵填色、提供靈感……而對于沒有受過系統(tǒng)性繪畫訓練的普通人來說,藝術(shù)創(chuàng)作的門檻也大大降低了,有網(wǎng)友用Midjourney合成了去世祖母在花叢里的照片,有網(wǎng)友用它為自己寫的同人小說制作插畫,這些在大模型和AIGC出現(xiàn)之前,都只能委托給專業(yè)畫家,歷經(jīng)漫長的等待來完成,而現(xiàn)在用AI繪圖只需一鍵即可完成。

普通人也能低成本甚至零成本地實現(xiàn)腦洞,AI大模型支撐下的創(chuàng)作自由才剛剛開始,因此也有創(chuàng)作者直言,“AI繪畫是在造福人類”。

3.AI知識產(chǎn)權(quán)保護,需要加速。

對于創(chuàng)作者來說,AI繪畫工具無疑是絕佳輔助,與此同時,避免AIGC的野蠻生長,因一些違規(guī)作畫的操作而陷入爭議和負面,也成為藝術(shù)界、AI界、法律界在一起共同討論、加速立法的當務(wù)之急。

目前來看,AI作畫的知識產(chǎn)權(quán)爭論焦點主要集中在三個方面:1.數(shù)據(jù)版權(quán)。AI模型訓練對于樣本數(shù)據(jù)的數(shù)量和覆蓋廣度有要求,如何確保數(shù)據(jù)版權(quán)的來源并予以保護;2.創(chuàng)作版權(quán)。數(shù)據(jù)只是侵權(quán)的第一步,“畫風抄襲”是畫師們非??鄲赖囊环N侵權(quán),AI生成畫作的元素、風格相似度要判定是否抄襲,比判定人類抄襲作品的難度更大;3.利益保護。目前大量AI繪畫工具都提供付費服務(wù),而一旦AI生成技術(shù)商用以后,作為數(shù)據(jù)源頭或創(chuàng)作者的人如何獲得合理回報和收益,目前也沒有有效的解決方案和保護手段。所以DALL-E 2直接規(guī)定,其使用者無法出售用它創(chuàng)作的任何藝術(shù)品。但如果能有一種措施,準確判斷貢獻度并將收益分配給貢獻者,比如聯(lián)邦學習技術(shù)、區(qū)塊鏈技術(shù)等的支持下,相信許多原創(chuàng)者也樂于參與到AIGC的產(chǎn)業(yè)化進程中。

有了法律與技術(shù)的保障,AI作畫才能在邊界內(nèi)加速人機合作,而非割裂與沖突。

總而言之,現(xiàn)代文明的演進,是一個世界的祛魅過程。工業(yè)化的過程,就是用蒸汽機、電氣化等科學技術(shù)的系統(tǒng)運用,去取代那些能工巧匠們的奧秘,而這個祛魅過程,也帶來了生產(chǎn)的大批量、高效率和低成本,普羅大眾的生活比傳統(tǒng)時代的任何時候都要便利和富足。

從這個意義來看,AIGC何嘗不是一個藝術(shù)祛魅的過程。就像Midjourney主創(chuàng)所說:美麗的石頭來自河流,但河流不是創(chuàng)作者。這套AI系統(tǒng)并無創(chuàng)造的能力,但美可以來自其中。(Every beautiful stone comes from the river, but is the river creative? No, I don’t think so. Is the system creative? No. Can beauty come out from it? Yes. )

沒有什么能瓦解人的靈魂和創(chuàng)造力,就像攝影術(shù)不會瓦解梵高和莫奈。智能時代,擁抱AI已成定局,這個進程中,人如何尋找到人的價值與意義,將是我們每個人所共同面臨的一個課題。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

AI作畫的人機戰(zhàn)爭走向何方?

對AI作畫的聲討,卻在近幾個月來,在社交媒體中發(fā)展到了一個高峰。

文|腦極體

AI對于人類職業(yè)的影響及其引發(fā)的輿論波瀾,迅猛到讓人難以想象。還記得2017年,AI還是個標準的新生事物,我們的核心工作之一就是向讀者們解釋,同聲傳譯、漫畫作家、主持人等人類工作短期內(nèi)仍是無法被AI取代的。而到了今年,一場因AI作畫而引發(fā)的人類畫家危機大討論卻在國內(nèi)外社交媒體上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……這些從文本生成圖像的AI作畫工具大量出現(xiàn),越來越受歡迎,市面上由AI生成的畫作越來越多,不斷刷新著大眾對AI能力邊界的認知,大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮,噴涌而出。

在AIGC的激變時刻,關(guān)于AI作畫的法律、倫理等問題也變得愈發(fā)重要,這場人機戰(zhàn)爭究竟走向何方?我們嘗試用一文說清整個事件的起承轉(zhuǎn)合。

起:引發(fā)眾怒的科技與狠活

AI生成的藝術(shù)畫作已經(jīng)存在了很長時間,2017年,AI繪畫就成為佳士得、蘇富比等高端拍賣場所的座上賓,拍出過數(shù)百萬美元的高價,除了引發(fā)行業(yè)內(nèi)人士的一些分析和唏噓之外,大眾輿論場并沒有掀起什么波瀾。

然而,對AI作畫的聲討,卻在近幾個月來,在社交媒體中發(fā)展到了一個高峰。

其一,大量畫師宣布抵制AI。今年8月29日,一個名叫mimic的AI繪畫網(wǎng)站上線了測試版,允許用戶上傳15至100張圖像讓AI進行學習,然后輸出相同畫風的AI畫作。然而一些未經(jīng)授權(quán)的畫作也被上傳學習,把AI生成的畫作當做自己的創(chuàng)作進行售賣。隨后又出現(xiàn)了有人將剛剛?cè)ナ赖漠嫾疑性诎鏅?quán)保護期間的作品上傳給AI學習,這些動作相繼引發(fā)了大批原創(chuàng)作者的不滿,從而抵制“AI學習”。

其二,輿論危機波及幾乎所有主流AI繪圖工具。mimic事件直接激發(fā)了大量畫師和讀者對AI的不滿情緒,有人刪除了自己的公開畫作,有人開始訴諸法律條文,一時間針對數(shù)據(jù)版權(quán)、技術(shù)倫理等的爭議,也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發(fā)現(xiàn),一些很火的工具如NovelAI,訓練學習所使用的數(shù)據(jù)來源網(wǎng)站也存在上傳無授權(quán)圖片的情況。

網(wǎng)站Danbooru發(fā)布的聲明顯示,像NovelAI這樣的生成器是在數(shù)千個網(wǎng)站的數(shù)十億張圖片上進行訓練的,包括Pixiv、Twitter、DeviantArt和Tumblr等藝術(shù)家網(wǎng)站,以及Reddit、Pinterest等網(wǎng)站,所以從Danbooru平臺上刪除作品并不會阻止AI繼續(xù)使用畫家在其他網(wǎng)站的作品。也就是說,只要是網(wǎng)絡(luò)上開放的,就有可能成為學習數(shù)據(jù),除了詢問模型的開發(fā)者之外,沒有其他方法可以阻止自己的作品被AI學習,除非畫家把自己的畫全網(wǎng)都刪完,否則也很難一一查清楚是否被用來學習了。

其三,個人使用AI作畫出現(xiàn)了大量爭議現(xiàn)象。隨著開發(fā)門檻的降低,大量個人AI開發(fā)者使用開源工具也出現(xiàn)了大量意料之外的情況,比如有人使用AI生成yhsq等違規(guī)內(nèi)容。9月6日,用AI繪圖工具Midjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會藝術(shù)比賽上獲得數(shù)字類別中的頭獎,也引發(fā)了不小的爭議,因為作者所付出的勞動就是輸入描述文字,AI就會將畫作按需求創(chuàng)作出來,被網(wǎng)友認為是“見證了藝術(shù)的死亡”“沒有意義,沒有靈魂”,藝術(shù)家Genel Jumalon更直言,“用一幅AI畫作在藝術(shù)領(lǐng)域獲得一等獎,真是該死的事”。

擔心AI取代人類畫師,將AI作畫視為對人類能力的貶低,成為一種正在傳染的情緒。

如前所說,AI生成繪畫并不是什么新鮮事物,為什么偏偏近期突然在大眾群體中掀起了水花,引發(fā)眾怒?人當然不是只靠最后一根稻草壓垮的。

承接:AI作畫的內(nèi)卷之路

有必要先來簡單了解一下,AI作畫是如何在幾年間從拍賣行、收藏家們關(guān)注的小眾藝術(shù),成長為大眾創(chuàng)作的主流標配。

計算機視覺一直是深度學習的主要任務(wù)方向之一,包括目標識別、目標跟蹤、圖像分割、圖形處理等,有著大量成熟且廣泛的應(yīng)用。具體到圖像生成領(lǐng)域,2015年左右,AI藝術(shù)創(chuàng)作主要是通過基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學習,來進行圖像風格轉(zhuǎn)換,先對圖像內(nèi)容進行語義分割,再將內(nèi)容和場景通過線條彎曲、風格遷移等手法,轉(zhuǎn)換成指定藝術(shù)風格,類似美顏軟件的“濾鏡”功能。顯然,這種生成方法的藝術(shù)價值并不高,能一鍵p圖的人也并不因此就自認是大藝術(shù)家,而且經(jīng)常出現(xiàn)很鬼畜的作品,谷歌深度學習繪畫系統(tǒng)DeepDream加工過的圖片就十分詭異。

AI生成真正開始展現(xiàn)出藝術(shù)價值和媲美人類的水平,是從2016年生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Nets)的走紅開始的,GAN模型的原理就是讓生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)相互對抗,從而創(chuàng)作出真實度和準確度都更高的全新圖像。這一時期,各種XXGAN的圖像生成器出現(xiàn),誕生了大量“以假亂真”的藝術(shù)作品。2018年10月佳士得以43.25 萬美元的價格拍賣了由AI創(chuàng)作的《愛德蒙·貝拉米肖像》,成為人類歷史上首次AI藝術(shù)品拍賣。

但是,GAN也不能擺脫傳統(tǒng)AI深度模型的問題:無法理解“邏輯”和“常識”,比如AI能夠根據(jù)文本關(guān)鍵詞把元素堆疊在一起,但因為無法理解隱藏在自然語言背后的邏輯關(guān)系,所以經(jīng)常會畫出非?!翱颂K魯”的反常識作品。而改變,來自預(yù)訓練大模型的興起。

通過大規(guī)模數(shù)據(jù)和暴力計算而訓練出來的大模型,展現(xiàn)出了強大的魯棒性,不僅在機器視覺領(lǐng)域表現(xiàn)優(yōu)異,而且還不斷迭代出了跨模態(tài)生成的能力,推動AI生成從語言走向視覺。這一波 “文本轉(zhuǎn)圖像”繪畫工具能夠產(chǎn)生以假亂真的畫作,背后的“腦力”普遍來自大模型基礎(chǔ)技術(shù)的支撐。在AI繪畫工具上展開技術(shù)競賽的谷歌、OpenAI、百度等都是大模型技術(shù)的佼佼者和AIGC的推動者。

讀懂了AI作畫的技術(shù)傳承之路,也就不難理解,為什么AI創(chuàng)作的爭議會在此時此刻被發(fā)酵。

首先, 巨頭云集,技術(shù)進展超乎想象。AI作畫匯聚了大量科技巨頭“亮肌肉”,包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者,使得技術(shù)突飛猛進,工具數(shù)量以前所未有的速度爆發(fā)性增長,AI作畫(圖像生成)能力也因內(nèi)卷而達到令人震驚的水平。2021年1月,OpenAI推出了DALL-E一年后,又推出了最新的DALL·E 2,分辨率提高4倍,可以從自然語言的描述中創(chuàng)建逼真的圖像。谷歌內(nèi)部就卷出了多個AI繪圖工具,包括Imagen、Parti等,微軟推出的AI繪圖平臺則起名為NUWA女媧,足見野心不小。

大模型優(yōu)秀的生成效果,使得AI作畫具備了一定的實用性和商用潛力,包括結(jié)合文本生成插畫、創(chuàng)意工作的初樣展示、自動完成勾線等重復(fù)機械勞動等,AIGC在走向產(chǎn)業(yè)的同時自然面臨傳統(tǒng)從業(yè)者的懷疑。

其次,大模型的積極開源,讓AI作畫門檻一降再降。

這一輪主流的AI繪圖工具都選擇了開源,繁榮大模型的開發(fā)生態(tài),降低技術(shù)的使用門檻,任何人都可以使用這些工具進行創(chuàng)作,有的甚至是免費的。比如英國初創(chuàng)公司Stability AI打造的StableDIffusion就完全開放,OpenAI在9月28日開放了Dall-E 2 并提供免費試用,NovelAI在10月3號開放,都吸引了大量用戶前去使用。

相比此前AIGC只作為小眾藝術(shù)品和收藏投資對象,基于大模型的AIGC讓更多人參與到訓練、開發(fā)和使用中來。盡管各個開源社區(qū)都明確公布了知識產(chǎn)權(quán)相關(guān)規(guī)定,包括不得用于成人內(nèi)容、仇恨或暴力圖像,避免使用受版權(quán)保護的材料。但隨著用戶的增多和門檻的下降,一旦有人不了解并遵守開源社區(qū)的知識產(chǎn)權(quán)規(guī)范和協(xié)議,違規(guī)情況就難免發(fā)生。

(DALL·E 2的內(nèi)容政策)

另外,法律空白與滯后,令原創(chuàng)者對維權(quán)感到無能為力。

依靠開源社區(qū)的約束是很難避免AI濫用,那么能不能依靠數(shù)字作品的專項法規(guī)來保護原創(chuàng)者的知識產(chǎn)權(quán)呢?現(xiàn)狀顯然是令人失望的,立法作為一件非常嚴肅的事情,往往具有一定的滯后性。與飛速發(fā)展的AI技術(shù)相比,對于AI生成的作品是否具有知識產(chǎn)權(quán)/著作權(quán),利用AI生成違規(guī)圖像如何處理,相關(guān)法律法規(guī)在全球范圍內(nèi)都還在空白和討論階段,目前只有個案作為參考。2019年斯蒂芬·泰勒(Stephen Thaler)希望將他發(fā)明的DABUS人工智能系統(tǒng)命名為“發(fā)明者”,并獲得相關(guān)發(fā)明專利,但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來,在全球范圍內(nèi),知識產(chǎn)權(quán)制度更注重人類創(chuàng)造,使用AI并點擊“go”并不被認為是創(chuàng)造性行為。比如深圳市南山法院就曾判定在一起案件中,AI輔助協(xié)作系統(tǒng)生成的文章,受到著作權(quán)法保護,擅自復(fù)制傳播需要承擔相應(yīng)的民事責任。

知識產(chǎn)權(quán)本身就存在的判定難、維權(quán)難的特點,而AI生成內(nèi)容法律保護的“缺位”,更加劇了維權(quán)的難度,很難約束違規(guī)使用,這也使得人類原創(chuàng)畫師面對AI繪畫工具,其知識產(chǎn)權(quán)也處于“真空”地帶。

技術(shù)、文化、倫理與法律等各種因素交織在一起,構(gòu)成了開篇中AI作畫的種種爭議和風波的緣起,這是一個環(huán)環(huán)相扣的故事。

轉(zhuǎn)與合:創(chuàng)作者的激變與新機

那么,有爭議是不是意味著AI作畫就此停滯了呢?還真不是!

事實上,經(jīng)過頻繁的討論,大量原創(chuàng)畫師對于AI繪畫工具都有了一定的嘗試和了解,從一些知名畫師的反饋來看,對于AI作畫這樣的AIGC應(yīng)用,普遍表現(xiàn)出了三種態(tài)度。

1.AI想取代人類畫師,還早。

某博主測試過后發(fā)現(xiàn),“搞出來的能看的圖多少有一些,但符合描述意圖的圖基本可以說沒有”;“AI畫畫其實在我這個修圖師眼里其實跟ps里那個填充功能差不多”。原因在于,AIGC的內(nèi)容質(zhì)量還有提升的空間。一方面,AI大模型的自然語言理解能力與人類還有很大的差距,GPT-3所生成的文本也就相當于小學生水平,這種情況下要讓AI繪圖工具理解復(fù)雜的文本,并準確用圖像表達出內(nèi)容思想,還是有點困難的。另一方面,在商業(yè)上,藝術(shù)品市場推崇的都是極富獨特性的作品,稀缺性一直是藝術(shù)品重要的定價標準,工業(yè)化、批量產(chǎn)出的東西對收藏家來說沒有價值,隨著AI繪畫工具的開源,手工制作的獨特產(chǎn)品或許才會成為人們追求的藝術(shù)。這種趨勢其實已經(jīng)出現(xiàn)了,有網(wǎng)友就認為未來約稿很可能“純手工”“零AI”反而會成為賣點。

一位創(chuàng)作博主直言:標榜自己的圖是手工繪圖的畫師,今后想要過得富足,或許需要盡量為自己的作品附加額外的價值——這種生活方式早已有人在運營,那就是藝術(shù)家們。

所以至少目前為止,AI繪畫工具能提供很多幫助,但還是無法取代人類畫師的。

2.AI作畫,確實有點用。

需要注意的是,藝術(shù)創(chuàng)作、藝術(shù)品收藏是一種相對小眾的活動,能夠成為藝術(shù)家的是極少數(shù)極小眾的一批人。不過,日常生產(chǎn)生活中存在大量視覺和設(shè)計工作。在這些領(lǐng)域中,AI已經(jīng)能夠扮演非常有用的“作圖助理”角色,成為大勢所趨。

一種是減少重復(fù)性/風險性工作。比如視覺創(chuàng)意中,與客戶溝通耗費大量時間和精力,存在大量不確定性,經(jīng)常畫完即使版后客戶說“還是第一版好”,遇到這種讓美工自閉的情況,AI就可以扮演起一個任勞任怨的乙方,快速生成多樣化的AI創(chuàng)意圖片,避免了過重的前期投入乃至返工。另外,每逢節(jié)日大促活動,美工難免就會遇到大量重復(fù)枯燥的工作,比如制作高度同質(zhì)化的海報,也可以由高水準的AI能力來完成。因此有設(shè)計師將DALL·E命名為“傻逼甲方終結(jié)者”。

另一種是AI作為輔助工具,提高設(shè)計師的工作效率。許多基于AI繪圖工具都已經(jīng)被開發(fā)為Figma、Photoshop、Blender等工具的插件,幫助創(chuàng)作者渲染細節(jié)、一鍵填色、提供靈感……而對于沒有受過系統(tǒng)性繪畫訓練的普通人來說,藝術(shù)創(chuàng)作的門檻也大大降低了,有網(wǎng)友用Midjourney合成了去世祖母在花叢里的照片,有網(wǎng)友用它為自己寫的同人小說制作插畫,這些在大模型和AIGC出現(xiàn)之前,都只能委托給專業(yè)畫家,歷經(jīng)漫長的等待來完成,而現(xiàn)在用AI繪圖只需一鍵即可完成。

普通人也能低成本甚至零成本地實現(xiàn)腦洞,AI大模型支撐下的創(chuàng)作自由才剛剛開始,因此也有創(chuàng)作者直言,“AI繪畫是在造福人類”。

3.AI知識產(chǎn)權(quán)保護,需要加速。

對于創(chuàng)作者來說,AI繪畫工具無疑是絕佳輔助,與此同時,避免AIGC的野蠻生長,因一些違規(guī)作畫的操作而陷入爭議和負面,也成為藝術(shù)界、AI界、法律界在一起共同討論、加速立法的當務(wù)之急。

目前來看,AI作畫的知識產(chǎn)權(quán)爭論焦點主要集中在三個方面:1.數(shù)據(jù)版權(quán)。AI模型訓練對于樣本數(shù)據(jù)的數(shù)量和覆蓋廣度有要求,如何確保數(shù)據(jù)版權(quán)的來源并予以保護;2.創(chuàng)作版權(quán)。數(shù)據(jù)只是侵權(quán)的第一步,“畫風抄襲”是畫師們非常苦惱的一種侵權(quán),AI生成畫作的元素、風格相似度要判定是否抄襲,比判定人類抄襲作品的難度更大;3.利益保護。目前大量AI繪畫工具都提供付費服務(wù),而一旦AI生成技術(shù)商用以后,作為數(shù)據(jù)源頭或創(chuàng)作者的人如何獲得合理回報和收益,目前也沒有有效的解決方案和保護手段。所以DALL-E 2直接規(guī)定,其使用者無法出售用它創(chuàng)作的任何藝術(shù)品。但如果能有一種措施,準確判斷貢獻度并將收益分配給貢獻者,比如聯(lián)邦學習技術(shù)、區(qū)塊鏈技術(shù)等的支持下,相信許多原創(chuàng)者也樂于參與到AIGC的產(chǎn)業(yè)化進程中。

有了法律與技術(shù)的保障,AI作畫才能在邊界內(nèi)加速人機合作,而非割裂與沖突。

總而言之,現(xiàn)代文明的演進,是一個世界的祛魅過程。工業(yè)化的過程,就是用蒸汽機、電氣化等科學技術(shù)的系統(tǒng)運用,去取代那些能工巧匠們的奧秘,而這個祛魅過程,也帶來了生產(chǎn)的大批量、高效率和低成本,普羅大眾的生活比傳統(tǒng)時代的任何時候都要便利和富足。

從這個意義來看,AIGC何嘗不是一個藝術(shù)祛魅的過程。就像Midjourney主創(chuàng)所說:美麗的石頭來自河流,但河流不是創(chuàng)作者。這套AI系統(tǒng)并無創(chuàng)造的能力,但美可以來自其中。(Every beautiful stone comes from the river, but is the river creative? No, I don’t think so. Is the system creative? No. Can beauty come out from it? Yes. )

沒有什么能瓦解人的靈魂和創(chuàng)造力,就像攝影術(shù)不會瓦解梵高和莫奈。智能時代,擁抱AI已成定局,這個進程中,人如何尋找到人的價值與意義,將是我們每個人所共同面臨的一個課題。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。