文|光錐智能 盧瀅西
2022年,元宇宙、Web3.0降溫后,AIGC成為了創(chuàng)業(yè)者們淘金的又一風(fēng)口。
在硅谷大廠待了5年的Lucy辭去了原來的全職工作,一頭扎進(jìn)了游戲開發(fā)的事業(yè)中,還把一款A(yù)I生成3D模型的工具帶回了國內(nèi)。
“第一款游戲在藝術(shù)設(shè)計(jì)的過程中,我們就發(fā)現(xiàn)了很多涉及到復(fù)雜且重復(fù)性的工作,其實(shí)都可以用AI來實(shí)現(xiàn)?!盠ucy告訴光錐智能。
談及項(xiàng)目的創(chuàng)立初衷,Lucy表示,最核心的一點(diǎn)還是看到了AIGC可商用的價(jià)值?!盁o論是Stable Diffusion,還是最近的OpenAI,底層邏輯上都是因?yàn)樯尚Ч木冗_(dá)標(biāo)了,慢慢為普通的消費(fèi)者所接受,所以我們就把創(chuàng)業(yè)提上了日程?!?/p>
從今年年初Disco Diffusion面世,再到MidJourney和DALL-E2的出現(xiàn),短短幾個月內(nèi)AI繪畫的迭代速度令人吃驚,特別是Stable Diffusion模型開源以后,徹底讓AIGC站上了風(fēng)口浪尖。
巨頭們聞風(fēng)而動,百度、騰訊、阿里巴巴以及字節(jié)跳動等大廠都在AIGC領(lǐng)域有所投入。在創(chuàng)業(yè)公司層面,涌入的公司更是多達(dá)數(shù)十家。
不過,相比于大廠有成熟的產(chǎn)品做載體,創(chuàng)業(yè)公司的路走得似乎更艱難。具體來看,國內(nèi)應(yīng)用層的創(chuàng)業(yè)公司,大多都是基于Stability AI或是OpenAI這類底座廠商的模型進(jìn)行二次開發(fā),很大程度上會受制于底層模型的性能。
再來看國外的情況,從2020年開始,OpenAI的商業(yè)化路徑逐漸顯露,語言模型GPT-3的API接口付費(fèi)開放以后,不到一年就吸引了約300家公司。不久前,OpenAI的DALL-E2也可以作為API使用,讓更多的開發(fā)者能夠基于該模型構(gòu)建自己的應(yīng)用程序。如今,OpenAI估值已經(jīng)超過了200億美元。
而Stability AI雖然是一家初創(chuàng)公司,但因?yàn)镾table Diffusion模型的研發(fā),不僅能夠在消費(fèi)級顯卡上實(shí)現(xiàn)DALL-E2級別的圖像生成,更重要的是,Stable Diffusion完全免費(fèi)開源,也就刺激了一大批創(chuàng)業(yè)公司的出現(xiàn)。
在這樣的背景之下,沒有技術(shù)底座的應(yīng)用層創(chuàng)業(yè)公司其實(shí)處境有些尷尬,特別是在Stable Diffusion模型開源之后涌入的這批公司。在6pen創(chuàng)始人王登科看來,Stable Diffusion模型開源以后把文生圖的門檻降得特別低,一時間出現(xiàn)了上百家AI繪畫的公司,也就導(dǎo)致了AI繪畫工具的泛濫以及產(chǎn)品的嚴(yán)重同質(zhì)化。
因此,打造產(chǎn)品的差異化,以及尋找合適的商業(yè)化場景落地,成為這些創(chuàng)業(yè)公司競爭的關(guān)鍵。
01 技術(shù)可商用,AIGC爆火的關(guān)鍵
2021年12月,工作室的第一款游戲正式發(fā)行,Lucy激動得一宿沒睡。
興奮、激動,但更感不易。
白天在科技公司上班、晚上下班回家寫游戲,這樣的日子持續(xù)了將近兩年半。Lucy告訴光錐智能,一開始的時候團(tuán)隊(duì)只有兩三個人,對于程序員出身的主創(chuàng)而言,做原型自然不在話下,但到了畫原畫、3D建模的時候,就顯得力不從心了。
對于游戲而言,3D動畫效果有助于游戲更有沉浸感,但沉浸感需要建立在每一個步驟都很貴的前提上。據(jù)了解,一個3D模型,需要先畫原畫,畫出來之后需要建模,步驟十分繁瑣復(fù)雜。
“每一個流程都是獨(dú)立的工種,一個獨(dú)立的游戲開發(fā)者不太可能完成,成本太高?!盠ucy表示,當(dāng)初在開發(fā)第一款游戲的時候,十幾人的小團(tuán)隊(duì)光是負(fù)責(zé)3D建模的成員就先后招了七八個。
那為什么不開發(fā)一款可以用以提高游戲開發(fā)效率的工具呢?
在Lucy看來,在游戲開發(fā)過程中生成藝術(shù)資產(chǎn)這一環(huán)節(jié)完全可以交給AI去做。從前,如果想要完成一個3D模型,從2D貼圖到3D模型可能需要花上一周甚至更長的時間,現(xiàn)在只需要不到20分鐘的時間就能直接生成。
而AI生成3D模型開發(fā)工具的存在,除了游戲開發(fā)以外,任何需要生成3D模型資產(chǎn)的場景都可以使用。起初,這個工具的主要作用只是輔助工作室內(nèi)部進(jìn)行游戲開發(fā),但產(chǎn)品出來以后,很多元宇宙、房地產(chǎn)廠商上門找到了Lucy,詢問其能不能把工具拿給他們的產(chǎn)品建模。
談及項(xiàng)目的創(chuàng)立初衷,Lucy分析道:“最主要的原因還是3D游戲越來越多,游戲制作成本越來越高,這兩點(diǎn)是客觀存在的?!睋?jù)悉,3D游戲的市場空間巨大,每年都有4-5萬的Steam游戲上線,而現(xiàn)在做一款3A游戲并不比拍一部科幻電影便宜多少,甚至更貴。
與此同時,AIGC底層技術(shù)的快速迭代,也讓Lucy看到了AIGC能夠商業(yè)化落地的希望?!爸癆IGC生成的東西基本都不能看,丑得奇形怪狀,要不就是畫質(zhì)很模糊,根本沒辦法商用?!盠ucy感嘆道。
可商用,成為了今年AIGC爆火的關(guān)鍵。
事實(shí)上,這一切都是有跡可循的。從今年年初Disco Diffusion走紅,但是存在生成速度慢、對人和物體的理解不明確等問題,到Midjourney和DALL-E2的內(nèi)測,再到Stable Diffusion模型的開源再一次降低了AIGC的門檻,底層邏輯上都是因?yàn)锳IGC的質(zhì)量慢慢達(dá)到了市場要求的標(biāo)準(zhǔn)。
盜夢師toB產(chǎn)品負(fù)責(zé)人李慶功告訴光錐智能,AI繪畫的出現(xiàn)讓內(nèi)容創(chuàng)作的門檻進(jìn)一步降低,既能夠賦能內(nèi)容創(chuàng)作工具,也可以重塑內(nèi)容創(chuàng)作行業(yè)的生產(chǎn)方式?!氨热缯f在市場營銷行業(yè)中,AIGC的出現(xiàn)帶來了一種全新的營銷方式,讓消費(fèi)者參與到品牌的互動當(dāng)中,用AIGC的方式,生成有用戶個性的品牌素材?!崩顟c功表示。
無論是3D游戲開發(fā),還是AI繪畫,技術(shù)成熟后可商用,造就了這一波AIGC創(chuàng)業(yè)浪潮中的機(jī)會。
02 產(chǎn)品同質(zhì)化,C端付費(fèi)意愿低
AIGC是一座富礦,但行業(yè)仍然處于商業(yè)化探索的初期也是不爭的事實(shí)。
在AIGC這片熱土上,你我皆是拓荒人。即使是像百度這樣的大廠,也無法繞開。光錐智能向百度的相關(guān)知情人士了解到,在商業(yè)化的實(shí)現(xiàn)上,文心一格目前已經(jīng)推出付費(fèi)版本,采用積分制,用戶通過消耗積分可以使用一格生成圖片,下載后允許個人使用和合法合規(guī)范圍內(nèi)的商用用途。
既然AIGC已經(jīng)走到了可商用的臨界點(diǎn),并且有如此多可以落地的場景,那為什么遲遲沒有在產(chǎn)業(yè)端實(shí)現(xiàn)爆發(fā)呢?
很多時候,一項(xiàng)前沿科技走出實(shí)驗(yàn)室轉(zhuǎn)化為商業(yè)化產(chǎn)品時,往往都需要經(jīng)過市場的驗(yàn)證?,F(xiàn)在擺在創(chuàng)業(yè)者們面前的就是無數(shù)道難題:AIGC的價(jià)值究竟要如何實(shí)現(xiàn)?做B端還是做C端?如何開展商業(yè)化?
在商業(yè)模式上,光錐智能觀察了國內(nèi)外幾家AI繪畫應(yīng)用的收費(fèi)情況,大多都是采取“一定免費(fèi)次數(shù)+付費(fèi)點(diǎn)數(shù)”的模式,比如DALL-E2、盜夢師以及6pen都是免費(fèi)生成一定數(shù)量的作品之后,按量進(jìn)行收費(fèi),海外的獨(dú)角獸jasper也是依靠著訂閱費(fèi)在2021年創(chuàng)造了4000萬美元的收入,今年預(yù)估收入為9000萬美元。
王登科告訴光錐智能,從今年5月份上線的第一天開始,6pen就制定了通過向用戶售賣點(diǎn)數(shù)的收費(fèi)規(guī)則,“這是最簡單也是我們認(rèn)為最可持續(xù)的一種模式?!痹谕醯强瓶磥?,如果Stable Diffusion沒有開源,這樣的商業(yè)模式的確是可以賺到錢的。今年5月上線的6pen,在不到半年的時間里就累積了不少用戶,9-10月份的收入甚至達(dá)到了幾十萬的級別。
只是誰都沒有預(yù)料到,8月底的時候Stability AI將Stable Diffusion模型開源了?!癝table Diffusion的開源導(dǎo)致了門檻進(jìn)一步降低,一下子出現(xiàn)了幾百家公司,大家越來越卷,產(chǎn)品同質(zhì)化也非常嚴(yán)重?!蓖醯强茻o奈道。
在產(chǎn)品嚴(yán)重同質(zhì)化的背景下,C端用戶的付費(fèi)意愿降低,因此,單純依靠售賣點(diǎn)數(shù)的商業(yè)模式已經(jīng)很難賺錢,需要找到產(chǎn)品的差異化并發(fā)掘新的商業(yè)想象空間。
在產(chǎn)品的差異化上,定制模型是6pen正在探索的一個方向。據(jù)悉,現(xiàn)階段大部分AI繪畫應(yīng)用所使用的模型都是比較通用的,但如果AI想要完成個性化的內(nèi)容創(chuàng)作,這時候就需要定制模型上場了?!岸ㄖ颇P湍軌蜃層脩糇约河?xùn)練模型,生成出來的結(jié)果是完全具有個人特色的?!蓖醯强票硎?。
與此同時,李慶功也向光錐智能介紹,因?yàn)橛脩粼诒I夢師生成作品的版權(quán)歸屬于用戶個人,因此,有一些C端用戶將自己生成的繪畫作品拿到淘寶進(jìn)行售賣,一幅作品的價(jià)格能夠賣到300元左右,而生成的成本只有幾毛錢。在這樣的模式之下,AI繪畫在C端的商業(yè)價(jià)值進(jìn)一步被放大。
值得注意的是,表面上看,雖然現(xiàn)在AIGC有很多亟待開發(fā)的應(yīng)用場景,但商業(yè)化落地遲遲無法繼續(xù)往前推進(jìn),核心原因在于,真正落地的過程中無法忽視的版權(quán)問題和生成可控性問題。
就拿這段時間最火的AI繪畫為例,生成的可控性差——玩過AI繪畫的人已經(jīng)見識過了,市面上大多數(shù)AI繪畫應(yīng)用都是基于底層的預(yù)訓(xùn)練大模型進(jìn)行開發(fā)的,應(yīng)用層的公司想要解決生成可控性問題,底層大模型的迭代和優(yōu)化很關(guān)鍵。
而版權(quán)問題自AI繪畫誕生以來,爭議就從未停止。
像Novel AI這樣基于Stable Diffusion模型做微調(diào)的模型,它微調(diào)用的素材大多都是D站(日本的一個二次元網(wǎng)站)上的圖片,D站上的很多二次元畫師對此意見非常大。不久前,Midjourney的子程序nijijourney無視版權(quán),大量收集個人畫師們的圖片用于訓(xùn)練模型的事情也在社交媒體上鬧得沸沸揚(yáng)揚(yáng)。
在這樣的情況下,如果著急去商用,可能會產(chǎn)生很多不必要的麻煩,這也就不難理解為什么市場暫時還不太敢用或者用不起來。
此外,產(chǎn)品的商業(yè)化對于創(chuàng)業(yè)團(tuán)隊(duì)本身而言也是一種考驗(yàn)。
“項(xiàng)目本身比較早期,很多投資人就在擔(dān)心這一點(diǎn),投資人跟我們說得最多的一句話可能就是'等你的產(chǎn)品出來'”,Lucy無奈地說道。
對于資本市場而言,看到方向好、團(tuán)隊(duì)好的項(xiàng)目腦子一熱就掏錢的時代已然成為歷史,雖然這一波AIGC的創(chuàng)業(yè)熱潮來勢洶洶,但能殺出重圍還是需要真正賺錢的能力。
在商業(yè)化的道路上,大家仍然是在摸著石頭過河。
03 尋找更長期的場景
萬事開頭難,所有技術(shù)從實(shí)驗(yàn)室里走出來,都有一個被接受的過程。
而對AIGC來說,產(chǎn)品還尚未定型。正如王登科所言,單純文生圖工具的生命周期并不會長,在如此短的生命周期里談商業(yè)價(jià)值,意義不大,更重要的是尋找更長期的場景。
對于6pen、盜夢師這類創(chuàng)業(yè)公司而言,現(xiàn)階段可能需要花更多的心思在打磨產(chǎn)品、打開市場和驗(yàn)證商業(yè)模式上,慢慢探索出適合自己的商業(yè)化路徑。
“整個行業(yè)還是處于早期的階段,所以我們選擇了B端和C端同時進(jìn)行,兩者能夠相互反哺、相輔相成?!崩顟c功表示,無論是B端還是C端,盜夢師這幾個月的漲勢都十分驚人,營收實(shí)現(xiàn)了200%-300%的增長。
光錐智能向李慶功了解到,在推向市場的過程當(dāng)中,盜夢師在每個行業(yè)都有一個“共創(chuàng)三部曲”:第一步是在行業(yè)中找到一個關(guān)鍵角色,并為關(guān)鍵角色提供新的工具,提高生產(chǎn)效率;第二步是推廣到行業(yè)里,讓所有人都用起來;第三步則是將這個行業(yè)的案例復(fù)制到其他行業(yè)里,實(shí)現(xiàn)規(guī)模化。
也正如李慶功所言,AIGC的商業(yè)化路徑上是一個不斷試錯以后,快速引爆應(yīng)用場景并放大價(jià)值的過程。目前,AIGC已經(jīng)撬動了不少應(yīng)用場景的潛在需求。據(jù)了解,盜夢師已經(jīng)和旅游、動漫、小說以及元宇宙等行業(yè)客戶進(jìn)行了合作,有廣闊的應(yīng)用場景亟待被開發(fā)。
以小說的宣發(fā)為例,過去的小說宣發(fā)是先由平臺方輸出劇本的精彩片段,再聯(lián)系幾百上千個KOL,讓KOL根據(jù)片段進(jìn)行短視頻的制作和分發(fā)。但在AIGC的技術(shù)介入以后,官方可以直接輸入片段的文字描述,就可以自動將文本生成圖片,并且將圖片自動拼接,最后包括bgm的卡點(diǎn)和人聲配音的加入、字幕的加入等流程都可以做成全自動的形式。
有應(yīng)用場景,有跑得通的商業(yè)模式,那么接下來,就是要解決上文所提到的兩個棘手問題。
針對爭議比較大的版權(quán)問題,目前業(yè)界尚未討論出一套行之有效的解決方案,但光錐智能了解到,不少初創(chuàng)企業(yè)也正在努力做出嘗試。
據(jù)悉,6pen正在探索和人類藝術(shù)家的一些合作模式,如果藝術(shù)家明確了作品不被使用的意愿,那么其作品就不會喂養(yǎng)模型;如果藝術(shù)家愿意合作,那就可以把他的作品加入到模型的訓(xùn)練當(dāng)中,按照用戶的使用頻率進(jìn)行付費(fèi)。
而在生成結(jié)果的可控性方面,相比于多數(shù)初創(chuàng)企業(yè)只能被動地等待諸如Stable Diffusion等模型的迭代,百度這樣的大廠自主性則更強(qiáng)。具體來看,文心一格使用了百度自研的文心ERNIE-ViLG 2.0作為AI繪畫的大模型底座,ERNIE-ViLG 2.0采用知識增強(qiáng)算法和混合專家擴(kuò)散模型建模,能夠進(jìn)一步提高了生成效果的準(zhǔn)確性和可控性。
總結(jié)下來不難發(fā)現(xiàn),在布局AIGC這件事上,大廠無論是技術(shù)儲備,還是產(chǎn)品化上都有其天然的優(yōu)勢。除了百度之外,騰訊AI Lab有能夠通過用戶提供的關(guān)鍵詞自動生成歌詞并演唱的虛擬歌手“艾靈”、能夠輔助疾病診斷的游戲AI“絕悟”,并且騰訊云今年還在加大數(shù)字人的布局;字節(jié)跳動也催生出了爆火全網(wǎng)的抖音AI繪畫特效,一個小特效+流量就玩出了爆款。
因此,創(chuàng)業(yè)公司想要在巨頭的夾擊下生存其實(shí)并不容易,但憑借著獨(dú)特的優(yōu)勢和機(jī)遇,在垂類場景中依然有可能成為新晉獨(dú)角獸。隨著技術(shù)的升級、產(chǎn)品的成熟,AIGC會在更多的場景中得到應(yīng)用,商業(yè)價(jià)值也會不斷地被挖掘出來。