正在閱讀:

生成式AI都會做視頻了 但商業(yè)化道路依舊漫長

掃一掃下載界面新聞APP

生成式AI都會做視頻了 但商業(yè)化道路依舊漫長

生成式AI跑的有點(diǎn)太快了。

文|首席消費(fèi)官 李東耳

生成式AI不僅成為國外科技領(lǐng)域的熱門投資賽道,也正在逼瘋內(nèi)容創(chuàng)作者。

近期,Meta和谷歌先后發(fā)布了幾條引爆科技圈的短視頻。這些視頻引發(fā)關(guān)注并非內(nèi)容做得多優(yōu)秀,反而都非常簡單,比如一匹正在喝水的馬,一只畫畫的玩具熊,或者一段騎摩托車的第一視角錄像,隨便找個高中生都可以隨手錄下一段。這些視頻引爆全球的真正原因則在于它們的制作方式:AI內(nèi)容生成。

這些短視頻的創(chuàng)作方式非常簡單,創(chuàng)作者僅僅需要向AI輸入一段話,甚至只是說一下要求,AI就可以根據(jù)需要生成一段視頻。

很多人在第一時間就認(rèn)為,這對于短視頻行業(yè)將是個巨大的沖擊。盡管短視頻的火熱還只是近幾年的事,但從生成式AI的發(fā)展速度來看,對視頻創(chuàng)作者的沖擊會在不久來臨。

AI不會的藝術(shù)又少了一個

從文字到語音再到圖片,Meta和谷歌已經(jīng)用實(shí)際作品向大家宣布,AI已經(jīng)可以根據(jù)使用者的需要“創(chuàng)作”人類目前大部分的藝術(shù)作品了。

這聽上去很玄幻,但已經(jīng)有人在這么做了。如AI語音播報也已經(jīng)大量被應(yīng)用在自媒體上;AIVA等AI制作軟件讓創(chuàng)作者可以在毫無音樂知識的情況下,僅僅通過AI就可以制作各種類型的音樂,并已經(jīng)有AI歌曲作品出現(xiàn)。

近期生成式AI最火的事情除了這一次兩大科技巨頭發(fā)布的AI生成視頻外,就是前段時間AI作畫奪冠了。雖然AI生成視頻這還是第一次,但AI作畫已經(jīng)出現(xiàn)了一段時間了,并且已經(jīng)出現(xiàn)了不少可免費(fèi)試用的工具。

隨著AI開始能夠創(chuàng)作視頻作品后,也將有望進(jìn)入電影等藝術(shù)領(lǐng)域,或許隨著AI生成視頻得到應(yīng)用后,影視行業(yè)也將迎來一次大升級,特別是在場景和特效方面,未來也可只用短短幾句話完成特效師加班一個月的工作。因此,AI生成視頻作品一經(jīng)公布,就有不少人想要讓Meta和谷歌開源。

不過,谷歌表示出于安全和倫理的考慮,暫時不會發(fā)布兩個視頻生成模型的代碼或Demo。雖然不知道谷歌何時能夠解決這些問題,但也只是時間問題,更何況并非沒有其他企業(yè)在研究相關(guān)技術(shù)。

國內(nèi)也已經(jīng)有不少生成式AI的應(yīng)用。除AI續(xù)寫、AI語音外,2022年1月,網(wǎng)易推出了一站式AI音樂創(chuàng)作平臺“網(wǎng)易天音”,將用戶編輯的新年祝福AI生成為歌曲,并在上半年推出了web端專業(yè)版。

此次亮相的AI自動生成視頻也并非第一次被提出,國內(nèi)字節(jié)跳動旗下的剪映APP提供AI生成視頻功能,并可以免費(fèi)使用。比如剪映的圖文成片功能和谷歌類似,創(chuàng)作者可以通過幾個關(guān)鍵詞或一小段文字生成一段創(chuàng)意小視頻。剪映還可以根據(jù)文字描述智能匹配視頻素材,將視頻包裝為更垂直的內(nèi)容作品,包括財經(jīng)、歷史、人文等類別。

生成式AI沖擊內(nèi)容生產(chǎn)者

AI生成視頻與其他AI生成作品的方式并沒有本質(zhì)上的不同,只不過生成視頻要比生成其他目前可以生成的作品要復(fù)雜一些,不僅計算成本高,還很依賴高質(zhì)量文本視頻數(shù)據(jù)數(shù)量。

但與其他類型生成類AI不同的是,若只是生成一個幾秒鐘的有聲音的動圖可能還沒那么麻煩,但只能生成這種非常短的片段對人們的工作生活意義不大,人們需要的是讓AI能夠用視頻的方式講故事。

這也是相對于Meta而言,谷歌這次能夠引起更多關(guān)注的原因。

谷歌發(fā)布的兩個AI生成視頻分別來自于Imagen Video和Phenaki,前者主要突出的是高清,與Meta的Make-A-Video沒有太多的差別。在Make-A-Video公布了AI生成的視頻后,AI圈就已經(jīng)玩了一波梗,一個能夠做出更高清視頻的AI還不足以在短時間內(nèi)戳中興奮點(diǎn)。

Phenaki更加令人震驚的地方在于,它可以制作出超過2分鐘的連貫的也有確切內(nèi)容的視頻,這才是真正讓人們感到恐懼的地方。因為無論AI生成的視頻多么高清,也只能是為內(nèi)容生產(chǎn)者提供一個靈感,一個素材,一個過場動畫。但能夠制作出有具體劇情內(nèi)容的短視頻就意味著,一些短視頻創(chuàng)作由AI代替人工完成已經(jīng)初步有了可能。

自AI誕生之日起,就一直有人擔(dān)心人工會被AI取代,事實(shí)證明,當(dāng)前的AI還無法勝任大部分創(chuàng)作工作,很多時候只是拿來娛樂,比如AI續(xù)寫系列能夠大火,就是因為AI總能在續(xù)寫過程中創(chuàng)造出來一些非常搞笑甚至毫無邏輯的橋段。這樣的作品娛樂足矣,或者可以在作者沒有思緒的時候給他提供一些創(chuàng)作靈感,但真投入到工作中,必然需要大量的人工修改才能成為一個基本合格的作品。

但AI的發(fā)展速度已經(jīng)超過大部分人的想象,并已經(jīng)開始影響到人們的工作。

近日,成都的一份兼職插畫師招聘啟示引發(fā)了不少人的討論。雖然該招聘啟示文字讀起來有點(diǎn)咄咄逼人,但只是直截了當(dāng)?shù)卣f出招聘需求而已,不足以擊垮一個成年人內(nèi)心。真正讓其崩潰的是工作內(nèi)容。

該招聘啟事顯示,該兼職的工作內(nèi)容就一個,使用AI(人工智能)繪圖生成不同風(fēng)格的插畫,篩選后精修。具體而言就是使用AI繪制軟件,使用關(guān)鍵詞生成圖片,以及對作品進(jìn)行清晰的圖層文件夾整理工作。

從其招聘啟事來看,這份名為插畫師的工作實(shí)際上與插畫師并沒有什么關(guān)系,至少不涉及傳統(tǒng)意義上的插畫師的能力要求,只要能熟練掌握PS,能夠翻墻,能夠快速交稿,審美在正常人的范圍內(nèi)就可以。至于其繪畫水平等專業(yè)素養(yǎng)反倒沒有要求。

過去插畫師這樣的工作常被插畫師們吐槽錢少事多沒前途,但至少還算是個技術(shù)工種,但這種招聘需求的出現(xiàn)意味著插畫師的門檻進(jìn)一步降低了,競爭越來越激烈,還是一次對插畫師職業(yè)前景的否定。當(dāng)前AI生成還不夠成熟,還需要“AI生成+人工干預(yù)”的方式進(jìn)行插畫繪制工作,那隨著AI生成技術(shù)的成熟,未來這些底層的插畫師們將何去何從?

如今常常被吐槽是“人工智障”的AI繪圖已經(jīng)威脅到了插畫師們的職業(yè)生涯,已經(jīng)初步具備視頻制作能力的生成式AI的出現(xiàn),進(jìn)一步加深了人們對于人與AI如何共生的思考。這或許也是谷歌所說的倫理問題的一部分。

生成式AI元年到來

盡管生成式AI當(dāng)前還離不開人工干預(yù),但不可否認(rèn)的是,生成式AI仍是AI發(fā)展的一個重要方向,具有非常大的發(fā)展?jié)摿ΑT贛eta、谷歌公布AI生成視頻前就有觀點(diǎn)認(rèn)為,2022年將是生成式AI從技術(shù)成熟到深入社會基本面的元年。根據(jù)Gartner上半年的數(shù)據(jù),預(yù)計到 2025 年,生成式AI將占所有生成數(shù)據(jù)的10%,當(dāng)前這一比例不到1%。

生成式AI的應(yīng)用場景也非常廣闊,除了文創(chuàng)、新聞等內(nèi)容生產(chǎn)行業(yè)外,生成式AI在醫(yī)療保健、數(shù)字商業(yè)、制造業(yè)、農(nóng)業(yè)等多個行業(yè)都有豐富的應(yīng)用前景,如幫助醫(yī)生檢測X射線、CT等設(shè)備掃描中的病變、創(chuàng)建商品的數(shù)字孿生體、輔助檢測產(chǎn)品質(zhì)量等。在XR、數(shù)字孿生、自動駕駛汽車等熱門技術(shù)上也有豐富的應(yīng)用空間。

但當(dāng)前生成式AI仍有很多問題需要解決。

如文娛領(lǐng)域,不少人采用生成式AI進(jìn)行創(chuàng)作的一個原因就是可以避免版權(quán)問題,但這并不代表沒有隱患。

一方面,AI的創(chuàng)作也是將學(xué)習(xí)到數(shù)據(jù)按照要求重新組合起來,雖然顆粒度越來越細(xì),但難免還是有眼尖的人會看出可能是參考了哪些作品,甚至有網(wǎng)友在社交平臺上表示曾在某AI生成圖片上隱約看到疑似簽名的痕跡。另一方面,當(dāng)前大部分AI生成平臺多不主張版權(quán)或明確表示可以進(jìn)行商用,但隨著生成式AI逐步商業(yè)化,這樣的版權(quán)環(huán)境是否存在,是否會出現(xiàn)新的版權(quán)問題也是需要討論的。

生成式AI的邏輯與安全性也有待提升。當(dāng)前的生成式AI很容易犯一些常識性的錯誤,在一些需要長期記憶的地方也容易出現(xiàn)問題。如在AI生成小說的過程中,經(jīng)常會因為篇幅較長而出現(xiàn)前后矛盾的地方。

因此,即便生成式AI已經(jīng)可以在很多領(lǐng)域得到應(yīng)用,真要讓生成式AI投入工作,還要通過大量的訓(xùn)練來避免因AI的“錯誤”造成的重大損失。畢竟醫(yī)療、制造業(yè)這些應(yīng)用場景沒有文創(chuàng)行業(yè)那樣的試錯空間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

谷歌

6.8k
  • 日本監(jiān)管機(jī)構(gòu)擬以涉嫌壟斷為由勒令谷歌整改,公司回應(yīng)
  • 日本據(jù)悉將認(rèn)定谷歌網(wǎng)絡(luò)搜索服務(wù)違反反壟斷法

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

生成式AI都會做視頻了 但商業(yè)化道路依舊漫長

生成式AI跑的有點(diǎn)太快了。

文|首席消費(fèi)官 李東耳

生成式AI不僅成為國外科技領(lǐng)域的熱門投資賽道,也正在逼瘋內(nèi)容創(chuàng)作者。

近期,Meta和谷歌先后發(fā)布了幾條引爆科技圈的短視頻。這些視頻引發(fā)關(guān)注并非內(nèi)容做得多優(yōu)秀,反而都非常簡單,比如一匹正在喝水的馬,一只畫畫的玩具熊,或者一段騎摩托車的第一視角錄像,隨便找個高中生都可以隨手錄下一段。這些視頻引爆全球的真正原因則在于它們的制作方式:AI內(nèi)容生成。

這些短視頻的創(chuàng)作方式非常簡單,創(chuàng)作者僅僅需要向AI輸入一段話,甚至只是說一下要求,AI就可以根據(jù)需要生成一段視頻。

很多人在第一時間就認(rèn)為,這對于短視頻行業(yè)將是個巨大的沖擊。盡管短視頻的火熱還只是近幾年的事,但從生成式AI的發(fā)展速度來看,對視頻創(chuàng)作者的沖擊會在不久來臨。

AI不會的藝術(shù)又少了一個

從文字到語音再到圖片,Meta和谷歌已經(jīng)用實(shí)際作品向大家宣布,AI已經(jīng)可以根據(jù)使用者的需要“創(chuàng)作”人類目前大部分的藝術(shù)作品了。

這聽上去很玄幻,但已經(jīng)有人在這么做了。如AI語音播報也已經(jīng)大量被應(yīng)用在自媒體上;AIVA等AI制作軟件讓創(chuàng)作者可以在毫無音樂知識的情況下,僅僅通過AI就可以制作各種類型的音樂,并已經(jīng)有AI歌曲作品出現(xiàn)。

近期生成式AI最火的事情除了這一次兩大科技巨頭發(fā)布的AI生成視頻外,就是前段時間AI作畫奪冠了。雖然AI生成視頻這還是第一次,但AI作畫已經(jīng)出現(xiàn)了一段時間了,并且已經(jīng)出現(xiàn)了不少可免費(fèi)試用的工具。

隨著AI開始能夠創(chuàng)作視頻作品后,也將有望進(jìn)入電影等藝術(shù)領(lǐng)域,或許隨著AI生成視頻得到應(yīng)用后,影視行業(yè)也將迎來一次大升級,特別是在場景和特效方面,未來也可只用短短幾句話完成特效師加班一個月的工作。因此,AI生成視頻作品一經(jīng)公布,就有不少人想要讓Meta和谷歌開源。

不過,谷歌表示出于安全和倫理的考慮,暫時不會發(fā)布兩個視頻生成模型的代碼或Demo。雖然不知道谷歌何時能夠解決這些問題,但也只是時間問題,更何況并非沒有其他企業(yè)在研究相關(guān)技術(shù)。

國內(nèi)也已經(jīng)有不少生成式AI的應(yīng)用。除AI續(xù)寫、AI語音外,2022年1月,網(wǎng)易推出了一站式AI音樂創(chuàng)作平臺“網(wǎng)易天音”,將用戶編輯的新年祝福AI生成為歌曲,并在上半年推出了web端專業(yè)版。

此次亮相的AI自動生成視頻也并非第一次被提出,國內(nèi)字節(jié)跳動旗下的剪映APP提供AI生成視頻功能,并可以免費(fèi)使用。比如剪映的圖文成片功能和谷歌類似,創(chuàng)作者可以通過幾個關(guān)鍵詞或一小段文字生成一段創(chuàng)意小視頻。剪映還可以根據(jù)文字描述智能匹配視頻素材,將視頻包裝為更垂直的內(nèi)容作品,包括財經(jīng)、歷史、人文等類別。

生成式AI沖擊內(nèi)容生產(chǎn)者

AI生成視頻與其他AI生成作品的方式并沒有本質(zhì)上的不同,只不過生成視頻要比生成其他目前可以生成的作品要復(fù)雜一些,不僅計算成本高,還很依賴高質(zhì)量文本視頻數(shù)據(jù)數(shù)量。

但與其他類型生成類AI不同的是,若只是生成一個幾秒鐘的有聲音的動圖可能還沒那么麻煩,但只能生成這種非常短的片段對人們的工作生活意義不大,人們需要的是讓AI能夠用視頻的方式講故事。

這也是相對于Meta而言,谷歌這次能夠引起更多關(guān)注的原因。

谷歌發(fā)布的兩個AI生成視頻分別來自于Imagen Video和Phenaki,前者主要突出的是高清,與Meta的Make-A-Video沒有太多的差別。在Make-A-Video公布了AI生成的視頻后,AI圈就已經(jīng)玩了一波梗,一個能夠做出更高清視頻的AI還不足以在短時間內(nèi)戳中興奮點(diǎn)。

Phenaki更加令人震驚的地方在于,它可以制作出超過2分鐘的連貫的也有確切內(nèi)容的視頻,這才是真正讓人們感到恐懼的地方。因為無論AI生成的視頻多么高清,也只能是為內(nèi)容生產(chǎn)者提供一個靈感,一個素材,一個過場動畫。但能夠制作出有具體劇情內(nèi)容的短視頻就意味著,一些短視頻創(chuàng)作由AI代替人工完成已經(jīng)初步有了可能。

自AI誕生之日起,就一直有人擔(dān)心人工會被AI取代,事實(shí)證明,當(dāng)前的AI還無法勝任大部分創(chuàng)作工作,很多時候只是拿來娛樂,比如AI續(xù)寫系列能夠大火,就是因為AI總能在續(xù)寫過程中創(chuàng)造出來一些非常搞笑甚至毫無邏輯的橋段。這樣的作品娛樂足矣,或者可以在作者沒有思緒的時候給他提供一些創(chuàng)作靈感,但真投入到工作中,必然需要大量的人工修改才能成為一個基本合格的作品。

但AI的發(fā)展速度已經(jīng)超過大部分人的想象,并已經(jīng)開始影響到人們的工作。

近日,成都的一份兼職插畫師招聘啟示引發(fā)了不少人的討論。雖然該招聘啟示文字讀起來有點(diǎn)咄咄逼人,但只是直截了當(dāng)?shù)卣f出招聘需求而已,不足以擊垮一個成年人內(nèi)心。真正讓其崩潰的是工作內(nèi)容。

該招聘啟事顯示,該兼職的工作內(nèi)容就一個,使用AI(人工智能)繪圖生成不同風(fēng)格的插畫,篩選后精修。具體而言就是使用AI繪制軟件,使用關(guān)鍵詞生成圖片,以及對作品進(jìn)行清晰的圖層文件夾整理工作。

從其招聘啟事來看,這份名為插畫師的工作實(shí)際上與插畫師并沒有什么關(guān)系,至少不涉及傳統(tǒng)意義上的插畫師的能力要求,只要能熟練掌握PS,能夠翻墻,能夠快速交稿,審美在正常人的范圍內(nèi)就可以。至于其繪畫水平等專業(yè)素養(yǎng)反倒沒有要求。

過去插畫師這樣的工作常被插畫師們吐槽錢少事多沒前途,但至少還算是個技術(shù)工種,但這種招聘需求的出現(xiàn)意味著插畫師的門檻進(jìn)一步降低了,競爭越來越激烈,還是一次對插畫師職業(yè)前景的否定。當(dāng)前AI生成還不夠成熟,還需要“AI生成+人工干預(yù)”的方式進(jìn)行插畫繪制工作,那隨著AI生成技術(shù)的成熟,未來這些底層的插畫師們將何去何從?

如今常常被吐槽是“人工智障”的AI繪圖已經(jīng)威脅到了插畫師們的職業(yè)生涯,已經(jīng)初步具備視頻制作能力的生成式AI的出現(xiàn),進(jìn)一步加深了人們對于人與AI如何共生的思考。這或許也是谷歌所說的倫理問題的一部分。

生成式AI元年到來

盡管生成式AI當(dāng)前還離不開人工干預(yù),但不可否認(rèn)的是,生成式AI仍是AI發(fā)展的一個重要方向,具有非常大的發(fā)展?jié)摿?。在Meta、谷歌公布AI生成視頻前就有觀點(diǎn)認(rèn)為,2022年將是生成式AI從技術(shù)成熟到深入社會基本面的元年。根據(jù)Gartner上半年的數(shù)據(jù),預(yù)計到 2025 年,生成式AI將占所有生成數(shù)據(jù)的10%,當(dāng)前這一比例不到1%。

生成式AI的應(yīng)用場景也非常廣闊,除了文創(chuàng)、新聞等內(nèi)容生產(chǎn)行業(yè)外,生成式AI在醫(yī)療保健、數(shù)字商業(yè)、制造業(yè)、農(nóng)業(yè)等多個行業(yè)都有豐富的應(yīng)用前景,如幫助醫(yī)生檢測X射線、CT等設(shè)備掃描中的病變、創(chuàng)建商品的數(shù)字孿生體、輔助檢測產(chǎn)品質(zhì)量等。在XR、數(shù)字孿生、自動駕駛汽車等熱門技術(shù)上也有豐富的應(yīng)用空間。

但當(dāng)前生成式AI仍有很多問題需要解決。

如文娛領(lǐng)域,不少人采用生成式AI進(jìn)行創(chuàng)作的一個原因就是可以避免版權(quán)問題,但這并不代表沒有隱患。

一方面,AI的創(chuàng)作也是將學(xué)習(xí)到數(shù)據(jù)按照要求重新組合起來,雖然顆粒度越來越細(xì),但難免還是有眼尖的人會看出可能是參考了哪些作品,甚至有網(wǎng)友在社交平臺上表示曾在某AI生成圖片上隱約看到疑似簽名的痕跡。另一方面,當(dāng)前大部分AI生成平臺多不主張版權(quán)或明確表示可以進(jìn)行商用,但隨著生成式AI逐步商業(yè)化,這樣的版權(quán)環(huán)境是否存在,是否會出現(xiàn)新的版權(quán)問題也是需要討論的。

生成式AI的邏輯與安全性也有待提升。當(dāng)前的生成式AI很容易犯一些常識性的錯誤,在一些需要長期記憶的地方也容易出現(xiàn)問題。如在AI生成小說的過程中,經(jīng)常會因為篇幅較長而出現(xiàn)前后矛盾的地方。

因此,即便生成式AI已經(jīng)可以在很多領(lǐng)域得到應(yīng)用,真要讓生成式AI投入工作,還要通過大量的訓(xùn)練來避免因AI的“錯誤”造成的重大損失。畢竟醫(yī)療、制造業(yè)這些應(yīng)用場景沒有文創(chuàng)行業(yè)那樣的試錯空間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。