文|獵云網(wǎng) 孫媛
2023年,大模型狂飆;但一級市場卻略顯十動然拒。
一邊,大廠跟大佬all in大模型的規(guī)劃掀起賽道的狂熱,有VC搶做一個吃螃蟹的人,數(shù)億元融資成大模型投早標(biāo)配。
譬如,啟明攜手經(jīng)緯,數(shù)億元天使輪投向周伯文創(chuàng)辦的銜遠科技;創(chuàng)新工場孵化的AI 2.0 大模型瀾舟科技,也續(xù)上一筆數(shù)億元Pre-A輪,斯道資本和創(chuàng)新工場持續(xù)加碼。
但到了另一邊,卻仿佛現(xiàn)實照進理想,大模型自研所需的“鈔能力”讓不少VC望而生畏。
一次運算450萬美元(約合3000萬元)的開銷,以及月薪2萬至10萬/人的重金求賢爭奪賽,讓某家美元基金相關(guān)人員直接表示,“不關(guān)注AI大模型,太貴了?!?/p>
更有投資人直言,真實情況是項目根本搶不起來。一是估值體系還不成熟,幾億一輪融資,釋放10到20個點的股權(quán),估值馬上超10億,而這估值還是按照一個大模型燒GPU消耗的成本去計算,而不是以其真正的商業(yè)價值去評估;二是國內(nèi)存在商業(yè)化落地以及時機的不確定性。
“大家看好宏觀趨勢,也更愿意做跟投,但到具體項目,要領(lǐng)投可太需要勇氣了。而且一起進場投,很可能會追高?!?/p>
但有VC放棄,就會有VC勇往直前。
有幾家機構(gòu)跟獵云網(wǎng)表示目前仍在持續(xù)學(xué)習(xí)中,但還未形成投資邏輯,處于想投但是多觀望的狀態(tài)。而這樣的狀態(tài)反應(yīng)到項目端,卻也引發(fā)了部分創(chuàng)業(yè)者的吐槽,有創(chuàng)業(yè)者表示,很多基金與其說是投資溝通,不如說是找他們學(xué)習(xí)。
“有VC還在問一些很基礎(chǔ)的問題,譬如大模型跟原來小模型有什么不同。天天給人教育,相當(dāng)于變成了一個免費的老師,后面的盡調(diào)也一直在問偏學(xué)術(shù)上的問題,商業(yè)上的考量都還沒有聊到?!?/p>
顯然,在一級市場投“真香”大模型上,多看少投甚至不投成為了大部分VC的日常。
國內(nèi)大模型“冷飯熱吃”
說起大模型,其實也不算什么新鮮概念。
國外超大規(guī)模預(yù)訓(xùn)練模型始于2018年谷歌提出BERT大規(guī)模預(yù)訓(xùn)練語言模型,并在2021年進入“軍備競賽”階段。
2020年,OpenAI推出GPT-3超大規(guī)模語言訓(xùn)練模型,參數(shù)達到1750億,用了大約兩年的時間,實現(xiàn)了模型規(guī)模從1億到上千億級的突破,并能實現(xiàn)作詩、聊天、生成代碼等功能。
再到2021年,谷歌推出的Switch Transformer模型成為歷史上首個萬億級語言模型多達 1.6 萬億個參數(shù),并在12月提出了具有 1.2 萬億參數(shù)的 GLaM 通用稀疏語言模型,在7項小樣本學(xué)習(xí)領(lǐng)域的性能優(yōu)于 GPT-3。
同期,國內(nèi)超大模型的研發(fā)發(fā)展也很迅速,2021年成為中國AI大模型爆發(fā)的一年。
商湯科技的計算機視覺模型、華為云聯(lián)合發(fā)布的盤古NLP超大規(guī)模預(yù)訓(xùn)練語言模型和盤古α超大規(guī)模預(yù)訓(xùn)練模型、阿里達摩院PLUG中文預(yù)訓(xùn)練模型以及聯(lián)合發(fā)布的M6中文多模態(tài)預(yù)訓(xùn)練模型以及百度的ERNIE 3.0 Titan模型陸續(xù)面世,其中達摩院M6模型的參數(shù)達到10萬億,直接將大模型的參數(shù)提升了一個量級。
雖然當(dāng)時國內(nèi)院校跟大廠都在做大模型,但在銀杏谷資本高級投資經(jīng)理鐘偉成看來,這更多是科研上的效果復(fù)現(xiàn),對國外較為前沿的AI模型的跟進。直到2022年年底StableDiffusion、ChatGPT的出現(xiàn),才開始讓更多業(yè)內(nèi)人士從觀望走向下場。
“之前產(chǎn)品的商用價值并沒有完全體現(xiàn)出來,大部分比較好的落地場景是心理慰藉的對話,或者文檔的改寫生成,以及此前的AI繪畫。ChatGPT出來后,大家發(fā)現(xiàn)說可以通過多輪對話去做不斷微調(diào)、上下文學(xué)習(xí),然后去生成更好的內(nèi)容?!?/p>
從技術(shù)和戰(zhàn)略層面上看,ChatGPT讓更多人意識到這不單只是一個應(yīng)用工具,甚至?xí)蔀橐粋€新的PaaS層基礎(chǔ)設(shè)施。從技術(shù)和戰(zhàn)略層面上,群雄爭霸,都想試圖成為一個新時代的基礎(chǔ)設(shè)施供應(yīng)商。
再到2023年,上市公司和大廠陸續(xù)放出做大模型的信號,AIGC概念股股價翻番,外加“AI的iPhone時刻 ”無不讓這股熱度從二級市場涌向一級,引發(fā)對語言大模型的重點關(guān)注。
風(fēng)口之下,從前年開始布局的學(xué)院派等語言大模型創(chuàng)企從去年開始浮出水面,擊中了有出手壓力的VC心巴。
鐘偉成表示,多數(shù)投資人在大環(huán)境不確定下,會傾向于尋求一些偏底層及回報較高、能最終形成一家獨大的投資領(lǐng)域,外加對錯過下一個時代風(fēng)口的焦慮,使得語言大模型項目成為了市面上最為性感的一類投資標(biāo)的。
然而賽道雖香,語言大模型的火爆表象下,技術(shù)差距并不止一點。
以當(dāng)前國內(nèi)大廠語言基礎(chǔ)大模型十幾億、幾百億的參數(shù)規(guī)模,以及大多數(shù)創(chuàng)業(yè)公司還在做一兩百億的參數(shù)模型來看,跟ChatGPT相比,還有2-3年的距離。
VC看多投少,項目端狂蹭熱點
正如上文所說,現(xiàn)在VC看大模型,光看鮮出手。
一方面,是因為一些基金是從AIGC火了后,才研究和關(guān)注大模型,開始找項目,正處于學(xué)習(xí)階段,而更主要的原因是貴。
以O(shè)penAI為例,其在推出GPT3的API接口出來之前,已經(jīng)燒了好幾億,后在微軟百億美元狂砸下,才有了GPT3的面世及能力的涌現(xiàn)。
所以想要對標(biāo)ChatGPT,資金必不可少。
鐘偉成表示,過去,團隊健全的大佬創(chuàng)業(yè)項目,一般第一輪估值2-3億元就已經(jīng)很高。但放到大模型創(chuàng)企來說,光1年租1000張GPU卡就要花大幾千萬到1億元的支出。
“這還只是試錯的成本,萬一技術(shù)路徑選錯了,模型訓(xùn)練的過程中出了一些bug,重新弄根本吃不消。天使輪估值就這么高,等退出還要7-8年,跑出來的還不一定是投資的那一家。冒著整支基金回報的風(fēng)險去投大模型,是項目推進時較大的阻力。”
與此同時,不同背景的基金之間,對于基金存續(xù)期以及試錯風(fēng)險的承受度都有不同的要求,部分基金會要求被投企業(yè)盡早做商業(yè)化嘗試,而這樣的投資模式跟慢工出細活的通用基礎(chǔ)大模型并不適配。
就目前來說,旗下有美元基金的機構(gòu)存續(xù)期較長,更容易下注投資語言大模型,但就目前主要投資早期輪來看,隨著語言大模型項目到第三四輪,一輪5-10億的砸錢下,估值到50億元后,誰來接盤又成為問題。
在鐘偉成看來,與百度阿里等大廠,有內(nèi)部資金支持科研團隊去做不同,國內(nèi)語言大模型創(chuàng)企,投資風(fēng)險高就在于不確定因素太多,早期VC基金攢局投完以后,后期輪還是需要國資機構(gòu)的投資介入,幫助創(chuàng)企緩和資金量,才能推動扶持出一家頭部企業(yè)。
他不禁感慨,“別看創(chuàng)業(yè)公司去做語言大模型好像很熱鬧,最后的格局可能還是一家特別大,兩家相對小的中文語言大模型存活下來?!?/p>
與此同時,以目前市面上的大模型項目來說,蹭熱點的也不在少數(shù)。
就華映資本董事劉天杰的感觸來說,他從年底開始開始看AIGC的項目,過去是一個月看5-10個,現(xiàn)在是每天都要看3-4個,其中大概有1/4跟大模型相關(guān)。在他看來,現(xiàn)在項目多到已經(jīng)成為繼上一波移動互聯(lián)網(wǎng)以來的新一輪全球狂潮。
“所有人都想第一波沖進去,挺正?!,F(xiàn)在很多做語音圖像識別的中后期輪甚至上市公司都在蹭這一波熱度,有些公司號稱做大模型,但最終是面向應(yīng)用的,其中大模型也得分語言大模型,以及中度的促進性模型?!?/p>
故而在一級市場上,普遍VC采取看多投少的節(jié)奏,尤其是在大模型底層還未確定能發(fā)展多快的情況下,美元基金偏好語言大模型,人民幣基金則更偏向應(yīng)用層,但總體出手還是相當(dāng)審慎。
此外,劉天杰還指出,上一波AI公司現(xiàn)在往AIGC靠攏,其實已經(jīng)很難追上。事實上,這就是一場AI的自我革命。
“國外大模型從2018年就開始研究,這不是一蹴而就的事情。傳統(tǒng)判別式或者做卷積網(wǎng)絡(luò)的AI團隊現(xiàn)在跳出來講大模型,但是他在傳統(tǒng)AI技術(shù)路線上投入了太多時間人力,歷史包袱成為其困局所在?!?/p>
同時,劉天杰也坦言,在基礎(chǔ)大模型領(lǐng)域,其實文字、圖形乃至視頻的創(chuàng)業(yè)機會都不大。
“因為這不是一個擁有幾個算法天才就能解決的事情,你需要一個非常龐大的算力基礎(chǔ),這可能現(xiàn)在連國內(nèi)的大廠都沒有,就更別說創(chuàng)業(yè)公司。同時你還需要一個巨大的高質(zhì)量數(shù)據(jù)集基礎(chǔ),純靠公網(wǎng)扒取、或者花錢去買,想要去做語言大模型真是挺困難?!?/p>
再回到現(xiàn)如今的大佬紛紛下場創(chuàng)業(yè),在鐘偉成看來也并非獨具優(yōu)勢。
“很多大佬是邀請了一些以前參與過大模型訓(xùn)練項目的人,把架構(gòu)搭起來重造,但其實不同量級的語言大模型訓(xùn)練,在工程化上都有很多不同的坑需要去逐步攻克,從0開始做,同行的競爭壓力還是蠻大的?!?/p>
應(yīng)用層暫時失寵,模型層投資機會在“細分”
短期來看,國內(nèi)互聯(lián)網(wǎng)大廠在研發(fā)語言及多模態(tài)大模型的節(jié)奏下,未來3-5年會出現(xiàn)各種不同垂直領(lǐng)域的大模型,甚至細分到各個公司私有化部署的大模型。
在這樣趨勢下,各家都會有一個嘗鮮期。
在鐘偉成看來,這就跟過去的中臺概念很像,短期內(nèi)激發(fā)一波需求,會有很多大廠或初創(chuàng)公司,去輔助大企業(yè)煉制自己的AI大模型。而中國的市場里面,長遠來看還是會走出一兩家通用的語言大模型,由百家爭鳴的狀態(tài)走向大一統(tǒng),且目前來看互聯(lián)網(wǎng)大廠的勝率較大。
“國內(nèi)公域流量上的中文語料非常差,優(yōu)質(zhì)的中文語料又集中在各個不同大廠的私域場景里,比方抖音的視頻數(shù)據(jù)、阿里的圖文數(shù)據(jù)、百度的文本數(shù)據(jù),還有知乎跟小紅書等,這些數(shù)據(jù)都是不會共享出來給外部去做通用的大模型訓(xùn)練。而有著私域數(shù)據(jù)及資金能力的互聯(lián)網(wǎng)大廠訓(xùn)練各自領(lǐng)域的大模型后,再看哪一家有能力擴展到更多行業(yè),變成一個通用的語言大模型,我覺得這是國內(nèi)大模型比較符合常理的一個發(fā)展過程。”
那既然創(chuàng)業(yè)公司做基礎(chǔ)大模型對標(biāo)ChatGPT的機會不大,那么大模型創(chuàng)業(yè)還能往哪卷?
對此,有投資人給出一些答案:投細分、投基礎(chǔ)設(shè)施。
劉天杰表示,現(xiàn)階段,國內(nèi)有一些大模型在垂直領(lǐng)域的細分機會可以查漏補缺,包括一些現(xiàn)在在國際上比較前沿的領(lǐng)域,比如3D大模型、視頻大模型、多模態(tài)大模型等中型模型。
“微軟英偉達,他們也沒有足夠多的3D數(shù)據(jù)去訓(xùn)練一個通用的3D大模型,而是用一些中型模型的路徑或者說用一些模型監(jiān)督強化學(xué)習(xí)的方式去迫近3D大模型。在這一點上,我覺得國內(nèi)公司是有機會的?!?/p>
對此,鐘偉成也持相同看法?!瓣P(guān)注垂直的語言大模型或多模態(tài)的大模型,國內(nèi)創(chuàng)企還是有一定的數(shù)據(jù)優(yōu)勢,譬如字節(jié)或快手的人去做視頻生成,就很有可能做成。我認為在垂直領(lǐng)域,市場規(guī)模足夠大、你進得足夠早,比別人先積累一些領(lǐng)域內(nèi)的私有數(shù)據(jù),很有可能做到行業(yè)一霸。”
此外,他也認為未來針對模型推理/訓(xùn)練的優(yōu)化、AI推理/訓(xùn)練專用芯片等AI基礎(chǔ)設(shè)施方向,也是有比較明確的市場需求。
值得注意的是,目前相較于模型層,應(yīng)用層暫時屬于失寵狀態(tài)。
過去移動互聯(lián)網(wǎng)或元宇宙浪潮,其最大特點是基礎(chǔ)設(shè)施發(fā)展較慢,但基礎(chǔ)設(shè)施架構(gòu)上的應(yīng)用發(fā)展較快。但到了這一波AI,基礎(chǔ)設(shè)施不僅已經(jīng)迎來爆發(fā)式增長,更在大廠大模型的涌入下,不斷變化著。
在劉天杰看來,這種情況下講應(yīng)用毫無意義,投入后一旦大廠發(fā)了一個新模型,就可能直接把應(yīng)用干翻。
“在這種情況下,我們第二波才會看應(yīng)用?,F(xiàn)在的AI公司,如果能在目前中文大模型不那么完善的情況下,釋放功能給C端積累大量的高質(zhì)量數(shù)據(jù)集,那這家公司才有意義和價值。”
此外,據(jù)鐘偉成透露,4月看大模型的投資人基本會對心儀的項目做最后推進,好幾家已經(jīng)close了。現(xiàn)在還在市面融資的大模型項目相對變少,但還是會有很多做應(yīng)用的AIGC項目主動找上門。
在他看來,眼下大廠百家爭鳴,大模型越割裂,對資本來說是一個利好,讓投資機構(gòu)有機會參與到垂直領(lǐng)域的大模型投資。但對于創(chuàng)業(yè)者來說,無論是模型層還是應(yīng)用層,都需要想清楚,一是找到一個AI原生的細分領(lǐng)域,二是認真思考其所帶來的根本性變化在哪,只是生成內(nèi)容,還是內(nèi)容的理解及后續(xù)合成。
顯然,這新一輪AI浪潮下,找VC拿錢的條件越來越高了。