文|霞光社 麻吉
編輯|劉景豐
一年前AI智能涌現(xiàn)的場景又重現(xiàn)。
2024開年,Sora就引發(fā)了全球科技圈的集體躁動。
當(dāng)?shù)貢r間2月15日,OpenAI發(fā)布最新視頻生成模型Sora。根據(jù)OpenAI描述,Sora可根據(jù)用戶輸入的簡短文本指令,生成長達(dá)1分鐘的高清視頻,并創(chuàng)建具有多個角色、特定類型的運(yùn)動以及準(zhǔn)確的主題和背景細(xì)節(jié)的復(fù)雜場景。
讓全球受眾感到驚嘆的,是Sora生成視頻中極具真實(shí)感的畫面呈現(xiàn),甚至還帶著些許電影質(zhì)感。
圖源:OpenAI網(wǎng)站截圖
在OpenAI發(fā)布的一系列不同主題視頻中,不論是戴墨鏡女子走在東京街頭的場景,或是動畫人物的細(xì)節(jié)塑造,雖然這些內(nèi)容完全由AI生成,但其中細(xì)節(jié)呈現(xiàn)出的畫面真實(shí)感已經(jīng)進(jìn)入一個全新維度。這讓不少網(wǎng)友感嘆,現(xiàn)實(shí)的邊界正在數(shù)字世界中變得愈發(fā)模糊。正如OpenAI 在Sora技術(shù)報告的標(biāo)題中赫然寫道的,“ Sora 這類視頻生成模型是「世界的模擬器」”。
對中國出海企業(yè)來說,AI技術(shù)推動下內(nèi)容生產(chǎn)力的大幅提升,也將進(jìn)一步助力產(chǎn)業(yè)升級,并加速企業(yè)的全球化步伐。而TikTok平臺上,已經(jīng)開始充斥各種由AI生成的視頻瘋狂吸粉。
去年初,OpenAI發(fā)布的大語言模型ChatGPT掀起了一輪人工智能的熱潮。ChatGPT上線后,幾乎所有全球科技大廠都全速投入AI領(lǐng)域,發(fā)布了自己的大語言模型,影響著人們?nèi)粘K阉餍畔ⅰ⒉檎屹Y料的方式發(fā)生改變。
而文生視頻模型Sora的發(fā)布,更直觀地呈現(xiàn)了AI技術(shù)正在以何種速度飛速發(fā)展。
在社交媒體X上一條Sora演示視頻下方,特斯拉創(chuàng)始人馬斯克發(fā)表評價說“gg 人類”(gg為Good Games縮寫,代指“打得好,我認(rèn)輸”)。他還表示,由人工智能增強(qiáng)的人類,將會在未來幾年之內(nèi)創(chuàng)作出最杰出的作品。
360集團(tuán)創(chuàng)始人、董事長周鴻祎則表示,Sora的誕生意味著AGI的實(shí)現(xiàn)將從10年縮短至1年。
“Sora把AI視頻能力推到了一個新的階段,是走向?qū)嵱没拈_始。視頻生產(chǎn)成本將大幅降低,所需要的技能也將和以前完全不同。以前的技能是如何找到優(yōu)質(zhì)的拍攝團(tuán)隊,場地,以及合適的價格進(jìn)行產(chǎn)品視頻拍攝,如何協(xié)調(diào)和溝通。之后的技能是如何寫prompt,如何讓AI把自己的產(chǎn)品不失真的融入到視頻里,如何讓視頻看起來真實(shí)清晰有質(zhì)感?!盤assioncy創(chuàng)始人郭林告訴霞光社。
就在近日,OpenAI的TikTok賬號上,各種由AI生成的視頻瘋狂吸粉,在短短數(shù)天時間內(nèi)吸粉超10萬,獲得超50萬次點(diǎn)贊。網(wǎng)友們紛紛留言感慨,短視頻創(chuàng)作者是否即將會被AI搶了飯碗,甚至連TikTok平臺都會受到影響。
雖然Sora還未正式開放給用戶使用,但已經(jīng)在資本市場掀起波瀾。市場預(yù)計,在最新一輪由風(fēng)投公司ThriveCapital牽頭的融資中,OpenAI的估值有望超過800億美元。作為對比,去年年初OpenAI發(fā)布ChatGPT不久后的估值約為290億美元。
而在Sora發(fā)布次日,幾家美國科技公司的股價便應(yīng)聲跌落。據(jù)媒體報道,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應(yīng)商Shutterstock跌超5%;幾周前發(fā)布了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。一天以內(nèi),這三家公司的市值就合計蒸發(fā)了近480億美元(折合人民幣近3500億元)。
對不少行業(yè)來說,Sora就像是一顆“重磅炸彈”,讓從業(yè)者在展望未來時既興奮又感到惶恐不安。
其中,影視業(yè)首當(dāng)其沖。在傳統(tǒng)的影視制作過程中,后期及特效制作往往需要投入大量人力、物力和時間,而Sora等AI工具將大大降低這些成本,幫助影視制作公司快速創(chuàng)建出高質(zhì)量的視頻片段,縮短制作周期。
在正舉行的柏林電影節(jié)上,Sora就成為電影人熱議的話題之一。
據(jù)外媒報道,洛杉磯導(dǎo)演戴夫·克拉克(Dave Clark)認(rèn)為,創(chuàng)作者需要接受人工智能技術(shù)來制作尚未想象或?qū)崿F(xiàn)的內(nèi)容,而不是感到威脅。
德國視覺特效工作室Trixter的董事總經(jīng)理克里斯蒂娜·卡斯珀斯-羅默(Christina Caspers-Roemer)則表示,像Sora這樣的人工智能工具被證明在工作流程中更高效、更快,但即便如此,電影和電視制作將仍然以人類創(chuàng)作為基礎(chǔ)。“最終我們的客戶總會回到現(xiàn)實(shí)世界?!彼f。
從ChatGPT、DALL-E3,再到Sora,AI內(nèi)容創(chuàng)作已經(jīng)從圖文席卷至視頻創(chuàng)作領(lǐng)域。
而實(shí)際上,Sora并不是第一個受到關(guān)注的文生視頻大模型。近年,全球科技大廠幾乎無一例外地重金投入人工智能領(lǐng)域,并計劃在未來持續(xù)甚至加大投入。
在Sora正式亮相以前,大部分全球頭部科技企業(yè)就已擁有自己的文生視頻大模型。
去年11月,文生視頻模型迎來了一波爆發(fā)。11月3日,Runway發(fā)布Gen-2更新,支持4K清晰度作品;11月16日,Meta發(fā)布文生視頻大模型Emu Video;11月18日,字節(jié)跳動發(fā)布PixelDance;11月21日,Stability AI發(fā)布生成式視頻模型Stable Video Diffusion……
今年1月,谷歌也發(fā)布了視頻生成模型Lumiere,專門用于將文本轉(zhuǎn)換為視頻。
目前,Sora仍處于開發(fā)早期階段,OpenAI表示,當(dāng)前的模式仍然存在不少弱點(diǎn)。Sora可能難以準(zhǔn)確模擬復(fù)雜場景的物理原理,也可能無法理解因果關(guān)系的具體實(shí)例。例如,一個人可能咬了一口餅干,但之后,餅干上可能沒有咬痕。
此外,該模型還可能混淆提示的空間細(xì)節(jié),例如混淆左和右,并且可能難以精確描述隨時間發(fā)生的事件。
而細(xì)心的網(wǎng)友也在Sora的演示視頻中發(fā)現(xiàn)了不少Bug?!氨热缭赟ora生成的一個視頻中,呈現(xiàn)的是中國農(nóng)歷新年舞龍的場景,雖然視頻里龍身上和建筑上的文字很像是中國書法撰寫的字體,但實(shí)際上并不是中國字,誰也不認(rèn)識寫的是什么,感覺只是AI臆想出來的中文。另一個視頻里的貓,動起來的時候有三只前腳?!标P(guān)注AI行業(yè)的一名讀者向霞光社表示。
圖源:OpenAI網(wǎng)站截圖
但即使如此,不論在生成視頻時長、實(shí)現(xiàn)單視頻多機(jī)位、擁有精準(zhǔn)物理規(guī)則的真實(shí)世界等技術(shù)層面,Sora均已實(shí)現(xiàn)“碾壓式”領(lǐng)先其他文生視頻模型,推動AI視頻生成進(jìn)入了一個新的時代。
Sora這樣的生成式AI工具,在降低成本和提高效率方面的顯著優(yōu)勢,為內(nèi)容創(chuàng)作、廣告娛樂等行業(yè)帶來了前所未有的發(fā)展契機(jī),也讓不同類型的中國出海企業(yè)看到了機(jī)會。
此前,一些企業(yè)將ChatGPT應(yīng)用于多個場景之中,實(shí)現(xiàn)降本增效。AMZ123的一項調(diào)查數(shù)據(jù)顯示,2023年,有33%的跨境公司使用ChatGPT,另有將近15%的公司預(yù)計將投入使用。
如今Sora尚未完全開放使用,但可以想見,通過更精準(zhǔn)的生成式人工智能,不論是制作TikTok等平臺短視頻,或是為自己的產(chǎn)品制作介紹視頻和推廣營銷視頻,都將能大大降低成本、提升效率。
“如何通過AI來生產(chǎn)真正能落地的視頻,是大家開始摸索的東西。Sora給行業(yè)帶來了顛覆性的影響,誰先用上包括Sora在內(nèi)的新AI技術(shù),誰就能吃到第一波行業(yè)紅利?!盤assioncy創(chuàng)始人郭林說,“中國公司出??隙ㄒ浞掷煤矛F(xiàn)有的AI能力。對于中小企業(yè),尤其很多工貿(mào)一體企業(yè)來說,難度其實(shí)是非常高的。這也是我們目前希望提供幫助的一個方向?!?/p>
一名廣告行業(yè)資深從業(yè)者也告訴霞光社,她認(rèn)為Sora將顛覆旅游、生活方式和服務(wù)行業(yè)的內(nèi)容。隨著視頻制作過程變得更簡單,大品牌廣告和小品牌廣告之間的界限將逐步縮小,而“講故事”等內(nèi)容創(chuàng)意環(huán)節(jié),將再次成為廣告中最重要的因素。
而在游戲出海領(lǐng)域,Share Creators創(chuàng)始人兼CEO Ada Liu認(rèn)為,視頻生成帶來的改變將是“跨時代”的。
“在游戲行業(yè), AI可以幫助生成前期的概念圖,UI icon等。計算機(jī)圖形制作的流程非常長,從3D制作,到渲染、合成,每個環(huán)節(jié)都需要投入大量專業(yè)的人員。尤其在風(fēng)格探索階段,如果直接生產(chǎn)出視頻,相當(dāng)于直接跳到最后一步,節(jié)省了大量的制作時間和成本。”
但 Ada Liu同時認(rèn)為,AI生成內(nèi)容想要完全取代人工還存在不少距離?!翱赡茉侔l(fā)展一兩年,能取代2D部分的一些低端批量制作工種。但主美之類定方向的美術(shù)人員,是不會被取代的。畢竟一個產(chǎn)品的美術(shù)風(fēng)格需要人來選擇?!?/p>
Ada表示,Sora的演示視頻效果令人印象深刻,但還是要關(guān)注實(shí)際上的效果,因為目前無法試用,只能等等看。而郭林也認(rèn)為,目前AI工具距離產(chǎn)出“真正能落地”的視頻,主要差距仍在于內(nèi)容真實(shí)性,以及工具易用性兩個方面。
根據(jù)IDC的預(yù)測,未來五年內(nèi),AIGC對于營銷、軟件測試等行業(yè)將帶來巨大影響。到2025年,35%的企業(yè)將掌握使用生成式人工智能來開發(fā)數(shù)字產(chǎn)品和服務(wù)。到2026年,生成式AI將承擔(dān)42%的傳統(tǒng)營銷瑣碎任務(wù),如搜索引擎優(yōu)化、內(nèi)容和網(wǎng)站優(yōu)化、客戶數(shù)據(jù)分析、細(xì)分、潛在客戶評分以及超級個性化。到2028年,基于生成式AI的工具將能夠編寫80%的軟件測試工作,從而減少對人工測試的需求,提高測試覆蓋率、軟件可用性和代碼質(zhì)量。
可以預(yù)見的是,即便AI生成內(nèi)容仍然面臨道德和濫用方面的潛在風(fēng)險,但其在創(chuàng)造力和效率方面的無限潛力,將持續(xù)吸引全球科技巨頭的加碼投入和爭奪。