文 | 娛樂資本論 James
前幾天,迪士尼旗下漫威發(fā)布新片《秘密入侵》,因其片頭為AI工具生成,而受到網(wǎng)上輿論猛烈抨擊。
批評者認(rèn)為,作為財大氣粗的工作室,漫威理應(yīng)雇傭真人完成工序,但卻用AI節(jié)省成本,特別在好萊塢導(dǎo)演編劇罷工期間,更顯得不合時宜。也有人得知是AI做的以后,又批評該片頭粗制濫造,是漫威歷史片頭中最難看的之一。
娛樂資本論旗下的視智未來認(rèn)為:
站在本片本身想表達(dá)的世界觀上,AI所體現(xiàn)的風(fēng)格是相得益彰的
但這部片頭遭遇的質(zhì)疑源于好萊塢正在進(jìn)行的罷工,因此承擔(dān)了很多不屬于它本身的爭議和罵名。
受到技術(shù)限制,AI 繪畫和生成視頻目前只能呈現(xiàn)某種“特殊風(fēng)格”。在適當(dāng)場合應(yīng)用“AI風(fēng)格”無可厚非。
在技術(shù)突破后,AI生成內(nèi)容將越來越精細(xì)和多樣化,能替代人類勞動的部分也越來越多。從效果,易用性和成本三方面看, AI普及的速度將快于以往的新技術(shù)。
單純情緒化地抵抗AI意義不大。它將讓新從業(yè)者掌握的“技術(shù)?!备淖?,人們要么再次培訓(xùn),要么下崗。這一點(diǎn)跟過去區(qū)別不大,但可能不是漸進(jìn)式的,而是突然發(fā)生,因此造成比較大的動蕩。
跟此事比較接近的國內(nèi)案例,可能是淘寶跟B站合拍的紀(jì)錄片《這貨哪來的》。其片頭動畫有明顯的AI風(fēng)格,即主體形象不變的同時畫面的細(xì)節(jié)在抖動。有消息說,該片頭做得比較早,技術(shù)上采用了Stable Diffusion的前輩Disco Diffusion。
對此,在紀(jì)錄片上映時也并沒有太大的抵制聲音,以“賽博朋克風(fēng)”的贊譽(yù)為主。
郭帆導(dǎo)演在我們的“首屆上海文娛科創(chuàng)沙龍”上講,AIGC用于影視制作可以“彎道超車好萊塢”。這事情確實(shí)有可能成真的原因之一,就是國內(nèi)也許缺少一種阻礙AI進(jìn)化的“道德壓力”。
技術(shù)還不完善,AI現(xiàn)在只是一種“畫風(fēng)”
讓我們回到那個最初的問題:迪士尼完全用得起制作片頭的這點(diǎn)人工,他們?yōu)槭裁催x擇了AI來制作這個片頭?
《秘密入侵》導(dǎo)演塞里姆(Ali Selim)對《綜藝》雜志表示,使用AI是為了營造一種“不祥”的氣氛:
“我們可以和電腦談?wù)撓敕?、主題、詞句(指輸入prompt),然后它就會去做某些事情。接著我們可以透過改變詞匯(指prompt)來做一些修改,它就會發(fā)生變化。這探索性的感覺令人興奮,又不同尋常?!?/p>
截至目前,AI處理靜幀導(dǎo)致的抖動問題仍然難以徹底根治,因此,當(dāng)多幅靜幀組成動畫的時候,實(shí)際上形成了一種特殊的藝術(shù)風(fēng)格,就是會產(chǎn)生那種稍微抖動的畫面,傳遞著一種不安定和躁動的情緒(比如說國內(nèi)觀眾更為熟悉的《蜘蛛俠:縱橫宇宙》)。
這實(shí)際上是因?yàn)樗囆g(shù)實(shí)現(xiàn)的材質(zhì)、介質(zhì)不同而導(dǎo)致的一種特殊的“藝術(shù)風(fēng)格”。將技術(shù)達(dá)不到時候只能得到的偶然結(jié)果雅稱為“風(fēng)格”只是權(quán)宜之計(jì),就好像:
宋代瓷器“五大名窯”會因?yàn)橥临|(zhì)、微量元素、燒制時間等等的不同,而有各種風(fēng)格上的差異。
早期相機(jī)的膠卷、相紙、沖印工藝差異帶來了黑白、拍立得、LOMO等風(fēng)格。
在計(jì)算機(jī)分辨率較低的時候,出現(xiàn)了類似馬賽克拼貼的像素藝術(shù);以及利用當(dāng)時簡單的MIDI音源,因陋就簡而創(chuàng)造的8-Bit音樂等等。
在AI生成視頻還只是一種“風(fēng)格”的時候,使用它其實(shí)是可以少一點(diǎn)“取代人類”的道德恐慌的,因?yàn)槿藗冃枰亩鄻踊乃囆g(shù)風(fēng)格,它此時還只能滿足其中的一兩種。
藝術(shù)評論家Chris Lambert就認(rèn)為,選擇使用AI創(chuàng)造與實(shí)現(xiàn)某種藝術(shù)形式,并非完全出于迪士尼“降本增效”的貪婪,而是有其藝術(shù)上的原因。
《秘密入侵》根據(jù)2008-2009年的漫威漫畫改編而成,講述一種稱為Skrull的變形外星物種,潛伏在地球上發(fā)動攻擊。這種潛伏依賴于Skrull具備模仿其他人外貌的能力,但他們無法完美地體現(xiàn)所模仿人的個性,因此細(xì)心觀察者可能會察覺到其中的不對勁之處。人們需要嘗試弄清楚誰是真正的人類,誰是Skrull。這種偏執(zhí)、懷疑和猜測的感覺,使得《秘密入侵》成為一個受歡迎的故事。
同樣地,AI能夠生成驚人且高質(zhì)量的藝術(shù)作品,但由于缺乏真正的感知和判斷能力,其作品往往帶有某種不真實(shí)感,從最初的六指、到后來的象形文字。隨著AI技術(shù)的不斷改進(jìn),這種事實(shí)錯誤正在日益減少,但仍可能讓人感受到一絲絲的不對勁。
因此,將AI制作的片頭動畫與《秘密入侵》的劇情相配,是因?yàn)樗鼈兌忌婕暗揭环N微妙而引人注目的交互關(guān)系,一種不安定感。這在藝術(shù)創(chuàng)作中相互呼應(yīng),具有重要意義,實(shí)現(xiàn)了形式(介質(zhì))和功能(創(chuàng)作主題)的統(tǒng)一。
實(shí)際上,與《太空歌劇院》或《剪刀石頭布》等作品相比,《秘密入侵》片頭包含了前置的很多深刻的思考和立意,最后才轉(zhuǎn)化為prompt(提示詞)。受到技術(shù)限制,人類員工也做了不少收尾工作,比如各個場景畫面之間的無縫轉(zhuǎn)換。
AIGC絕不會止步于此
不過,AI生成視頻技術(shù)并不是僅僅為了創(chuàng)造一種新的藝術(shù)風(fēng)格,而是希望最終快速生成任何人類歷史上已有的藝術(shù)形式;特別是當(dāng)在訓(xùn)練過程中使用了不同人類藝術(shù)家的風(fēng)格數(shù)據(jù)后,輸入這個藝術(shù)家的名字,就可以還原其畫風(fēng)的時候。
即使只看現(xiàn)有技術(shù),特定“畫風(fēng)”的定格動畫或動態(tài)漫畫,其實(shí)也可以大差不差地交給AI來做了。實(shí)際上,我們娛樂資本論(對,我們!娛樂資本論!一家媒體?。┮舱谧鲆粋€綜合使用Stable Diffusion 和 Midjourney 來參與電影級動畫短片制作的項(xiàng)目,會在適當(dāng)時機(jī)披露更多信息。
這就好像:
瓷器制作的技術(shù)不斷進(jìn)步,其目標(biāo)是量產(chǎn)出沒有瑕疵的、耐用的產(chǎn)品,并大幅降低售價,使平民百姓也可以使用。
如今的相機(jī)融入手機(jī)當(dāng)中,可以高度還原現(xiàn)場真實(shí),也可以后期處理成想要的任何一種“相紙”或“畫風(fēng)”。
計(jì)算機(jī)的多媒體能力日新月異,顯示更復(fù)雜、逼真的圖像,發(fā)出更有臨場感的聲音,直到VR/AR沉浸式地模擬環(huán)境。
技術(shù)發(fā)展的目標(biāo)有三個:效果好,操作簡單,價格低廉,最后完成從專業(yè)人士向大眾的普及。之前的多個技術(shù)進(jìn)步最后都同時實(shí)現(xiàn)了這些目標(biāo)。假以時日,AIGC也會做到這些,分歧只在于是需要5年還是20年。
但是,這個時間上的區(qū)別可能決定了有些人的人生軌跡。如果替代是和風(fēng)細(xì)雨的、漸進(jìn)式的,他也許可以軟著陸安全退休;如果替代在一夜之間發(fā)生,他將不得不轉(zhuǎn)行。
文娛傳媒行業(yè)歷史上多次發(fā)生過這種“技術(shù)?!北粡氐最嵏驳那闆r:
激光照排技術(shù)讓書報印刷業(yè)淘汰了擅長挑出鉛字并嵌入字板,來“物理”排版的員工。
電腦和噴繪進(jìn)入戶外廣告行業(yè),取代了原來以畫壁畫、寫美術(shù)字和使用裁紙刀為業(yè)的廣告員工。
Photoshop和InDesign等產(chǎn)品改變了平面設(shè)計(jì)行業(yè)的面貌,同時終結(jié)了手繪修圖和拼貼排版兩大流派。如今,“手繪”一詞也可以指使用手寫板畫畫。
我們能手動拉住技術(shù)前進(jìn)的韁繩嗎?
這些被替代的過程各自持續(xù)了多久呢?這個問題,是由這些技術(shù)的上述三個維度決定的:效果好不好,操作是否簡易,以及特別是價格的高低。
在中國,1980年代末“麥金塔”電腦進(jìn)入一線城市和省會的廣告市場,但直到十年后,廣大的中國小城鎮(zhèn)和農(nóng)村還是能看到傳統(tǒng)的剪刀裁剪的燈箱牌匾上的藝術(shù)字,以及刷墻工藝。與此同時,噴繪機(jī)器的精細(xì)度也是與時俱進(jìn),幾年前城里淘汰下來的粗顆粒點(diǎn)噴繪機(jī)會流傳到更小的城市。
與之類似,AIGC技術(shù)也有一個逐步下放的過程。如果今年高考作文題有人提到ChatGPT,農(nóng)村孩子會因?yàn)椴涣私舛鵁o法作答。但問題在于,好萊塢代表的影視行業(yè)是一個嚴(yán)格限定于第一世界、一線城市的行業(yè),任何新技術(shù)都將第一時間在他們這里試驗(yàn)和應(yīng)用。假設(shè)AI工具要有個下沉傳導(dǎo),那唯一沾點(diǎn)邊的只有土味短視頻了,跟現(xiàn)在討論的事情關(guān)系不大。
其實(shí),如果按照以往這些技術(shù)的發(fā)展速度,那么截至去年,AI在影視行業(yè)的應(yīng)用還保持在讓大部分從業(yè)者非常安心的程度,比如換臉,配音,對口型,改臺詞。今年三四月份有一個演示視頻,展現(xiàn)了某個獲獎的影片如何使用AI來屏蔽其中的臟話,并將其語言修改為日語,而此時演員的口型會跟著變。
現(xiàn)在抱怨《秘密入侵》的人,在那些案例出現(xiàn)時并沒有恐慌。這些每一個工作背后,也都是一些人收入下降,或者失去本應(yīng)有的一單,但看起來就比全片AI直出好受多了。
可以說,現(xiàn)在AI帶來技術(shù)棧顛覆的速度,確實(shí)是超過了從業(yè)者的心理預(yù)期。這一替代過程如果不是漸進(jìn)式的,就會帶來行業(yè)的動蕩。因此,他們寄希望于用政治正確的宣言,促進(jìn)相關(guān)法規(guī),來延緩一些已經(jīng)研發(fā)出來的技術(shù)被實(shí)際應(yīng)用的進(jìn)度,給從業(yè)人員轉(zhuǎn)型提供喘息之機(jī)。然而如果像中國這樣的第三國市場并沒有同步剎車,那么好萊塢在這方面就反而會落后。
在AI多出點(diǎn)力之后,中國人做的電影,是沒法翻譯成29種語言呢,還是沒法把演員換個膚色呢?是沒法被搬運(yùn)到Y(jié)ouTube呢,還是不能組織專業(yè)影評呢?AIGC能做到更好的自動翻譯,換臉技術(shù)也已經(jīng)很成熟,這些不是愿景,而是現(xiàn)在就做得到的事?,F(xiàn)在國產(chǎn)電影譯制出海還是挺麻煩的,當(dāng)這些工作的綜合成本低到一定程度時,參與進(jìn)來的影片數(shù)量和質(zhì)量就會迎來一場爆發(fā)。
語言障礙的消除,有助于西方觀眾不帶濾鏡地對待其它文化區(qū)的優(yōu)秀靈感,而不是以“異域風(fēng)情”的心態(tài),僅僅接受異質(zhì)性明顯的外語片。最終這會稀釋掉好萊塢對全球電影工業(yè)的頭部把控力,進(jìn)一步消除罷工者們手中握著的稀缺性。
挑戰(zhàn)好萊塢在電影業(yè)獨(dú)一份的特殊地位,是世界其他多元文化長期以來的一個夢想。歷史告訴我們,最容易實(shí)現(xiàn)這個夢想的方法,是自下而上的,是創(chuàng)作能力的民主化——就像在OpenAI和MJ之外,最有可能實(shí)現(xiàn)AIGC夢想的辦法是開源。
寫在最后
在上文引用到的評論中,Lambert很遺憾人們因?yàn)榱T工期間的“大是大非”問題,而忽略了探究AI生成內(nèi)容的藝術(shù)性批判。他希望后人有機(jī)會以更客觀的姿態(tài)來看待這些作品。
或許是因?yàn)椤笆虏魂P(guān)己”,我們在審視《秘密入侵》片頭的藝術(shù)性時,倒是可以摘掉一層“有色眼鏡”,不至于因?yàn)橹雷髡呤茿I,就對畫作看低一眼。盡管如此,在小的藝術(shù)圈子內(nèi),比如寫詩的貼吧和豆瓣群組、畫師聚集的論壇等地方,還是會出現(xiàn)跟好萊塢一樣的偏見。
某個AI團(tuán)隊(duì)早在2018-19年,就試驗(yàn)性地將AI生成的古體詩、現(xiàn)代詩、抽象畫等發(fā)布到人類聚集的討論組,并假裝是人類發(fā)布,收獲其他人煞有介事的藝術(shù)評論。有時他們主動公開身份后,會收到一些氣急敗壞的辱罵。當(dāng)時的技術(shù)肯定沒有現(xiàn)在這樣成熟和更具威脅性。
就像被命名為《泉》的小便池,和名為《丑角》的一根香蕉那樣,某個藝術(shù)作品的好壞判斷往往不跟其中包含的人類勞動多少直接掛鉤。對于明確由人類操刀創(chuàng)作的藝術(shù)品,其評價體系是多元而寬容的。
我們相信,隨著時間推移,一些現(xiàn)在工作受到AI潛在影響的人,都會逐步完成再培訓(xùn)或新機(jī)會的分流。當(dāng)人們更多“事不關(guān)己”的時候,類似這樣非理性的抵制聲音將會越來越少。大家也就可以就事論事,一視同仁地看待AI生成的作品和產(chǎn)品。