文|定焦 王璐
編輯|魏佳
Sora有多火?
馬斯克、楊立昆、賈揚(yáng)清、Jim Fan、謝賽寧等各路大佬都在討論,周鴻祎更是喊出,Sora的誕生意味著AGI(通用人工智能)的實(shí)現(xiàn)或從十年縮短至一兩年。
不少“普通人”也提前嗅到商機(jī),圍繞Sora搞錢(qián)的生意先火了。有媒體報(bào)道,一張網(wǎng)傳截圖顯示,某機(jī)構(gòu)已售出2萬(wàn)多份Sora培訓(xùn)課程,輕松到手200萬(wàn)。
如今,距離2月16日OpenAI發(fā)布文生視頻大模型Sora已經(jīng)過(guò)去快一周,但討論依舊熱烈,這實(shí)在是因?yàn)樗^(guò)于優(yōu)秀。
功能上,它能生成長(zhǎng)達(dá)60秒的視頻內(nèi)容,遠(yuǎn)超其他文生視頻工具幾秒至十幾秒的限額;它還能進(jìn)行自我編輯和擴(kuò)展,將兩個(gè)不相關(guān)的內(nèi)容過(guò)渡在一起,能轉(zhuǎn)換主角周?chē)娘L(fēng)格和環(huán)境等;
前景上,Sora不僅是視頻生成工具,它更被視為世界模擬器;
創(chuàng)始團(tuán)隊(duì)上,也堪稱傳奇,核心成員包括12人,成立尚未超過(guò)1年,由兩名剛剛畢業(yè)的博士生帶隊(duì),其中還有00后。
在興奮之余,Sora的強(qiáng)大也讓一些內(nèi)容創(chuàng)作者有了危機(jī)意識(shí),有網(wǎng)友評(píng)價(jià),“長(zhǎng)短視頻、游戲行業(yè)的朋友們一整年都不會(huì)快樂(lè)了?!?/p>
多位業(yè)內(nèi)人士指出,以目前Sora生成視頻的長(zhǎng)度來(lái)看,它的到來(lái)最先會(huì)沖擊到短視頻領(lǐng)域。一旦大范圍推廣,Sora將大大降低短視頻創(chuàng)作門(mén)檻,豐富短視頻平臺(tái)的內(nèi)容供給,但隨之而來(lái)的問(wèn)題是,AI生成內(nèi)容的增多可能會(huì)影響平臺(tái)的內(nèi)容生態(tài),同時(shí)Sora還會(huì)和剪映、快影等工具搶奪用戶,讓此前的大筆投入付諸東流。
Sora朝短視頻領(lǐng)域扔下了一枚重磅炸彈,考驗(yàn)創(chuàng)作者和抖音快手們的時(shí)刻到了。
Sora降低了門(mén)檻,也增加了競(jìng)爭(zhēng)
雖然市面上已經(jīng)有不少文成視頻工具,比如Pika、Runway,用戶輸入文字就能得到一段幾秒到十幾秒的視頻內(nèi)容,但目前它們并未被廣泛使用,主要原因還是效果一般。
某MCN機(jī)構(gòu)負(fù)責(zé)人大成告訴「定焦」,他使用過(guò)Runway,“我們還從外部購(gòu)買(mǎi)了優(yōu)質(zhì)素材,但最終生成的內(nèi)容不夠精良,根本用不了?!?/p>
看到Sora后,他十分激動(dòng),“時(shí)長(zhǎng)能達(dá)到60秒,內(nèi)容還合乎邏輯,感覺(jué)和之前的工具不在一個(gè)層次上。”
“Sora與此前的同類(lèi)產(chǎn)品相比,效果好了不止10倍?!比斯ぶ悄茉谧x博士、做過(guò)相關(guān)大模型研究的牛小博表示?!澳壳癝ora60秒的穩(wěn)定生成效果,將對(duì)短視頻行業(yè)帶來(lái)革命性影響。”
研究AI的阿涅也表達(dá)了相同觀點(diǎn),“創(chuàng)作者的門(mén)檻被降低,哪怕視頻的可信度還沒(méi)那么高,甚至?xí)霈F(xiàn)一些錯(cuò)誤,但不仔細(xì)很難看出來(lái),將來(lái)技術(shù)也會(huì)很快迭代?!?/p>
綜合多位從業(yè)者的說(shuō)法,Sora直接解決了文生視頻領(lǐng)域的兩大難題,準(zhǔn)確性和一致性。
AI研究者Cyrus的感受是,與之前的工具相比,“Sora就像三體人打原始人”。
所謂準(zhǔn)確性,指生成的視頻能準(zhǔn)確識(shí)別用戶輸入的文字需求,一致性是指,在運(yùn)動(dòng)過(guò)程中,主角在多視角運(yùn)動(dòng)變化中內(nèi)容連貫,不會(huì)發(fā)生形變,同時(shí)其變化還能遵循物理規(guī)律。最明顯的表現(xiàn)是,主角和背景的互動(dòng)符合邏輯。
一年前,牛小博和團(tuán)隊(duì)還在探討生成式AI無(wú)法了解空間尺度,比如生成圖尺寸不對(duì),但他們覺(jué)得,Sora的出現(xiàn)已經(jīng)解決了這個(gè)問(wèn)題。
有人用視頻還原物理空間模型,發(fā)現(xiàn)也能夠?qū)?yīng)上,牛小博覺(jué)得這證明了Sora的空間計(jì)算能力基本正確,而人對(duì)空間的感知很大一部分也依靠視覺(jué)。
從這個(gè)角度看,Sora生成的視頻背后,有物理空間的邏輯支撐。
綜合多位受訪者的觀點(diǎn)和多位科技界大佬的公開(kāi)發(fā)言,盡管還有瑕疵,但Sora給視頻乃至整個(gè)人工智能領(lǐng)域的重大突破在于,這是一個(gè)更智能、甚至具備一定思維能力的模型,其生成的視頻能理解物理世界的客觀規(guī)律。
這也讓一批做短視頻內(nèi)容的從業(yè)者開(kāi)始思考,Sora到底會(huì)不會(huì)搶自己的飯碗?
我們把現(xiàn)有的短視頻簡(jiǎn)單分為兩類(lèi),一類(lèi)由真人出鏡,往往真人就是一個(gè)賬號(hào)甚至一家公司的“核心資產(chǎn)”,Sora對(duì)這類(lèi)內(nèi)容的沖擊并不大;另一類(lèi)由素材集合而成,考驗(yàn)拍攝、創(chuàng)意能力。Sora的出現(xiàn),將大大提升這類(lèi)視頻的生產(chǎn)效率。
一些想要提高產(chǎn)量的創(chuàng)作者,非常期待Sora的到來(lái)。
大成表示,這類(lèi)工具完全可以取代公司的低端勞動(dòng)?!拔覀児倔w量小,為了節(jié)省成本招了很多大學(xué)生,但他們剛畢業(yè),半天憋不出一個(gè)文案,用了AI,幾分鐘就能寫(xiě)出上百條?!?/p>
去年他和團(tuán)隊(duì)就開(kāi)始大規(guī)模使用AI工具了,“雖然這些工具還不成熟,但處理文案和粗剪,都很好用。作為一家視頻生產(chǎn)商,一定要提高效率?!彼硎?。
對(duì)于一些有創(chuàng)意的團(tuán)隊(duì)來(lái)說(shuō),則認(rèn)為短期內(nèi)Sora不會(huì)對(duì)他們產(chǎn)生威脅。
頭部MCN機(jī)構(gòu)負(fù)責(zé)人達(dá)克告訴「定焦」,“Sora還沒(méi)有開(kāi)始公測(cè),該技術(shù)離成熟還有很長(zhǎng)一段時(shí)間,而且我們的視頻主要靠人的創(chuàng)意、頭腦風(fēng)暴,包括拍攝也是講究創(chuàng)新的,鏡頭如何設(shè)計(jì)、如何過(guò)渡,都有思考。雖然Sora很強(qiáng)大,但完不成我們目前的創(chuàng)意設(shè)計(jì)需求?!彼€透露,目前公司沒(méi)有使用任何AI工具。
不過(guò),這些創(chuàng)作者們必須面對(duì)的問(wèn)題是,Sora的出現(xiàn)降低了短視頻創(chuàng)作門(mén)檻,會(huì)有越來(lái)越多的人加入,跟他們搶奪流量和變現(xiàn)機(jī)會(huì)。
一名新媒體從業(yè)者表示,他們有內(nèi)容創(chuàng)作能力,但苦于沒(méi)有合適的視頻拍攝、剪輯團(tuán)隊(duì),新的工具出現(xiàn),就是他們的機(jī)會(huì)。
綜合多位業(yè)內(nèi)人士的觀點(diǎn),在類(lèi)型上,目前Sora對(duì)真人出鏡類(lèi)短視頻影響較小,對(duì)動(dòng)漫類(lèi)、解說(shuō)類(lèi)內(nèi)容影響比較大,甚至?xí)蕴芏鄾](méi)有創(chuàng)意、只蹭熱點(diǎn)的批量做號(hào)公司。在崗位上,部分做機(jī)械性重復(fù)工作的人員可能會(huì)面臨淘汰,但創(chuàng)意類(lèi)人員會(huì)被提至更高位置。
總之,未來(lái)做短視頻,參與者更多,競(jìng)爭(zhēng)也更激烈。
抖音快手們會(huì)慌嗎?
Sora的出現(xiàn),將給短視頻平臺(tái)帶來(lái)更加豐富的供給,但同時(shí)也讓抖音快手們面臨新的考驗(yàn)。
從業(yè)者表示,一方面,AI生成視頻過(guò)多,會(huì)對(duì)短視頻平臺(tái)原有的內(nèi)容生態(tài)造成沖擊,另一方面,Sora的火爆,會(huì)搶走一部分抖音、快手旗下剪映、快影等工具的用戶。
達(dá)克告訴「定焦」,AI生成的內(nèi)容在上傳短視頻平臺(tái)時(shí),需要特殊標(biāo)注。
去年5月,抖音就發(fā)布了《抖音關(guān)于人工智能生成內(nèi)容的平臺(tái)規(guī)范暨行業(yè)倡議》,這一倡議提出,要對(duì)該類(lèi)內(nèi)容進(jìn)行顯著標(biāo)識(shí),虛擬人使用者需要實(shí)名認(rèn)證,同時(shí)對(duì)利用AI工具創(chuàng)作、發(fā)布侵犯肖像權(quán)、弄虛作假等內(nèi)容進(jìn)行嚴(yán)格處罰。
快手、小紅書(shū)等平臺(tái)也有相關(guān)的限制。今年2月,小紅書(shū)官方發(fā)布AI創(chuàng)作內(nèi)容的規(guī)范,要求創(chuàng)作者主動(dòng)聲明AI創(chuàng)作內(nèi)容、不能用AI創(chuàng)作內(nèi)容虛構(gòu)使用體驗(yàn)進(jìn)行商業(yè)變現(xiàn)等。
多位從業(yè)者表示,他們能夠明顯感覺(jué)到,平臺(tái)在控制該類(lèi)內(nèi)容,甚至?xí)蘖鳌?/p>
“AI創(chuàng)作的內(nèi)容同質(zhì)化嚴(yán)重,且創(chuàng)意性不高,用戶一旦刷到太多相似內(nèi)容,就會(huì)變得不耐煩,甚至轉(zhuǎn)戰(zhàn)其他平臺(tái)?!币晃换ヂ?lián)網(wǎng)行業(yè)觀察者表示。
他還覺(jué)得,“如果平臺(tái)對(duì)這類(lèi)內(nèi)容不做限制,越來(lái)越多創(chuàng)作者也會(huì)圖省事使用AI,這會(huì)嚴(yán)重影響到平臺(tái)各類(lèi)內(nèi)容占比,最直觀的是,一些獨(dú)有的、稀缺的視頻會(huì)減少?!?/p>
以及還有可能會(huì)誕生大量虛假視頻。Sora能快速生產(chǎn)大量逼真的短視頻,也讓造假變得輕而易舉,一些用戶對(duì)該類(lèi)內(nèi)容難辨真?zhèn)危坏┍或_,平臺(tái)公信力也會(huì)受到嚴(yán)重影響。去年,利用文生圖、AI換臉等AI生成內(nèi)容進(jìn)行詐騙的案件就被曝出不少。
在Cyrus看來(lái),如果平臺(tái)扶持AI創(chuàng)作類(lèi)內(nèi)容,很像“為他人做嫁衣” ,結(jié)果就是影響用戶留存。“設(shè)想一下,如果小紅書(shū)上全是字節(jié)豆包大模型生產(chǎn)的內(nèi)容,用戶為什么不直接刷抖音呢?反之亦然?!?/p>
Cyrus預(yù)測(cè),抖音、快手、小紅書(shū)、B站上,不會(huì)大量推薦AI創(chuàng)作的內(nèi)容。除非是平臺(tái)自己做的文生視頻大模型,在自家進(jìn)行大范圍推廣后,進(jìn)行單獨(dú)變現(xiàn)?!氨热绠?dāng)其優(yōu)化到一定程度,可以直接走用戶付費(fèi)模式,但各家的產(chǎn)品目前都不具備這一能力?!?/p>
不止一位業(yè)內(nèi)人士推斷,Sora和其他AI視頻創(chuàng)作工具之間的差距會(huì)越來(lái)越大,此前,“Sora會(huì)不會(huì)殺死剪映”的話題就曾引發(fā)熱議。Sora如果被大規(guī)模應(yīng)用,大多數(shù)AI工具可能會(huì)被市場(chǎng)拋棄,其他公司前期的大筆投入將付諸東流。
為什么差距會(huì)拉大?
周鴻祎曾公開(kāi)指出,國(guó)內(nèi)的大模型發(fā)展水平表面上看接近GPT-3.5,實(shí)際上離4.0還有一年半的差距。牛小博從技術(shù)端給出解釋,Sora不是一個(gè)點(diǎn)狀技術(shù),而是一個(gè)復(fù)雜的系統(tǒng)工程。即便外界知道其核心技術(shù)是transformer注意力算法+diffusion的擴(kuò)散算法等,但其背后是OpenAI給予的資金支持和積累的超強(qiáng)數(shù)據(jù)。
OpenAI通過(guò)積累的GPT通用語(yǔ)言模型加上DALL-E3圖像生成模型,發(fā)展出視頻能夠理解圖片內(nèi)容,到Sora的時(shí)候,又提升了一致性和物理空間理解能力,這每一步的積累,缺一不可。
更大的預(yù)測(cè)更是讓抖音們前路難料。有影視從業(yè)者認(rèn)為,Sora被大范圍使用后,有可能會(huì)出現(xiàn)比抖音更大的新平臺(tái)。
在一部分人看來(lái),Sora降低了用戶門(mén)檻,必然導(dǎo)致內(nèi)容創(chuàng)作者數(shù)量級(jí)猛增,而抖音這樣的短視頻平臺(tái),其體量、內(nèi)容創(chuàng)作和推送的邏輯規(guī)則,能否承載該類(lèi)內(nèi)容很難說(shuō),很可能會(huì)誕生一個(gè)與Sora更相符合的平臺(tái)。
牛小博通過(guò)觀察互聯(lián)網(wǎng)行業(yè)的發(fā)展,也贊同這一觀點(diǎn)。“互聯(lián)網(wǎng)在早期是專業(yè)用戶使用,后來(lái)PC的普及擴(kuò)大了用戶,接著智能手機(jī)出現(xiàn),人人可以聯(lián)網(wǎng),以至于服務(wù)各類(lèi)人群需求的平臺(tái)都出來(lái)了。也許隨著Sora使用人群的增加,會(huì)有新的生態(tài)出現(xiàn)。”
Sora影響巨大,但不必神化
目前,Sora還沒(méi)有開(kāi)放公測(cè),只有一些視覺(jué)藝術(shù)家、電影制作人、OpenAI員工等人士獲得了訪問(wèn)權(quán)限。一部分原因是,Sora并非完美無(wú)缺。它對(duì)短視頻的沖擊,還沒(méi)有完全展現(xiàn)。
AI訓(xùn)練師小剛指出,Sora存在大模型普遍存在的“幻覺(jué)問(wèn)題”,它在理解物理規(guī)律、人與物體交互等方面還存在缺陷。
比如OpenAI官網(wǎng)公布了一些缺陷視頻,包括蠟燭吹不滅、投籃時(shí)籃球在下落過(guò)程中爆炸,以及挖出來(lái)的椅子直接漂起來(lái)等不符合物理規(guī)律的內(nèi)容,這是因?yàn)镾ora的理解還不夠成熟,誤以為從沙子里挖出來(lái)的東西,一般都比較輕。
而具體到短視頻行業(yè),小剛認(rèn)為Sora最重要的一個(gè)不足是,還做不到人物固定。
舉個(gè)例子,比如創(chuàng)作者用Sora生成了一條60秒的視頻,畫(huà)面中主角為A,但其在生成下一個(gè)視頻后,主角很可能就換成了B。
相比Pika、Runway,大家能看到Sora的空間能力很強(qiáng),但內(nèi)容再短,做不到人物固定就沒(méi)有意義,用戶持續(xù)在短視頻平臺(tái)觀看內(nèi)容,無(wú)論是真人還是動(dòng)畫(huà),都需要一個(gè)中心人物保證故事的延續(xù)性。
以及算力問(wèn)題,也讓很多人擔(dān)憂Sora的普及速度。畢竟技術(shù)突破再大,如果成本過(guò)高,還是難以被大眾接受。多名業(yè)內(nèi)人士認(rèn)為,這是目前Sora面臨的最大困難。
“目前OpenAI沒(méi)有公布Sora具體的算力、能源消耗需求以及參數(shù)量。初步判斷,它需要的數(shù)據(jù)量、算力以及大量的能源消耗將是巨大成本,而這與其下個(gè)階段的廣泛推廣必然存在矛盾?!迸P〔┱J(rèn)為。
每一次新技術(shù)的出現(xiàn),都會(huì)引發(fā)一場(chǎng)新舊交替的大討論。
虛擬拍攝技術(shù)剛誕生時(shí),為影視行業(yè)節(jié)省了拍攝成本,但傳統(tǒng)的拍攝方式至今仍然存在。OpenAI推出ChatGPT一年多以來(lái),文字從業(yè)者也沒(méi)有被替代,反而讓更多人意識(shí)到優(yōu)質(zhì)內(nèi)容創(chuàng)作者的價(jià)值。
同理,Sora對(duì)市場(chǎng)上同類(lèi)AI工具帶來(lái)了沖擊,但它再?gòu)?qiáng),淘汰的更多是沒(méi)有創(chuàng)意、只想走量的短視頻從業(yè)者,或是不會(huì)使用這類(lèi)工具的人。
至于Sora是否會(huì)顛覆整個(gè)短視頻行業(yè),會(huì)不會(huì)誕生下一個(gè)超級(jí)平臺(tái),目前大家還在觀望,需要看Sora能否迅速解決現(xiàn)有問(wèn)題,以及國(guó)內(nèi)有沒(méi)有新的挑戰(zhàn)者誕生。
應(yīng)受訪者要求,文中達(dá)克為化名。