文|劉曠
隨著ChatGPT在全球范圍內(nèi)迅速爆紅,AI大模型賽道的熱潮也開(kāi)始從國(guó)外涌向國(guó)內(nèi),并隨之急速升溫。而作為新一代的顛覆性技術(shù),AI大模型一度被視為一次全新的生產(chǎn)力革命。因此,各路玩家都圍繞“AI大模型”發(fā)布了一系列產(chǎn)品,國(guó)內(nèi)AI界也開(kāi)始上演一場(chǎng)關(guān)于“大模型”的戰(zhàn)爭(zhēng)。
縱觀國(guó)內(nèi)當(dāng)下涉足AI大模型賽道的玩家,主要可分為以阿里、騰訊、百度等為代表的互聯(lián)網(wǎng)廠商和以商湯科技、昆侖萬(wàn)維、科大訊飛等為代表的科技公司,以及以王小川、王慧文等為代表的初創(chuàng)企業(yè)。而正所謂,八仙過(guò)海各顯神通,這三類不同屬性的參與者在這場(chǎng)“千模大戰(zhàn)”中也展現(xiàn)出了其獨(dú)特的優(yōu)勢(shì)。
互聯(lián)網(wǎng)大廠資源傍身
國(guó)產(chǎn)AI大模型賽道熱鬧非凡,互聯(lián)網(wǎng)廠商們紛紛摩拳擦掌。百度和阿里先后上線了各自的大規(guī)模語(yǔ)言模型“文心一言”和“通義千問(wèn)”;騰訊、網(wǎng)易、京東也相繼公開(kāi)了自家的大模型產(chǎn)品“混元”、“玉言”和“ChatJD”。而一眾互聯(lián)網(wǎng)大廠之所以能夠競(jìng)相推出自己的AI大模型新品或研發(fā)計(jì)劃,其背后的實(shí)力不容小覷。
首先,互聯(lián)網(wǎng)大廠擁有雄厚的資金儲(chǔ)備,能夠長(zhǎng)期有效地支持其AI大模型的創(chuàng)新和研發(fā)。高算力代表著高成本,這就意味著AI大模型需要高昂的訓(xùn)練費(fèi)用和研發(fā)投入,而沒(méi)有雄厚的資金支撐,幾乎沒(méi)有跑完全程的希望。相比較而言,互聯(lián)網(wǎng)大廠資金儲(chǔ)備充足,能保證大模型的正常運(yùn)行。據(jù)公開(kāi)資料顯示,無(wú)論是百度、阿里還是騰訊,每年研發(fā)投入資金就高達(dá)百億元,研發(fā)團(tuán)隊(duì)人數(shù)破萬(wàn),在技術(shù)研發(fā)上實(shí)力雄厚,是目前當(dāng)之無(wú)愧的“第一梯隊(duì)”玩家。
其次,互聯(lián)網(wǎng)大廠積累了海量數(shù)據(jù)參數(shù),可以在一定程度上提升AI大模型的能力和效用。數(shù)據(jù)是大模型的基礎(chǔ),目前來(lái)看,通過(guò)大規(guī)模數(shù)據(jù)訓(xùn)練超大參數(shù)量的巨量模型,被認(rèn)為是非常有希望實(shí)現(xiàn)通用人工智能的一個(gè)重要方向。而“BAT”等互聯(lián)網(wǎng)大廠流量大、用戶覆蓋面廣,能夠?yàn)榇竽P偷纳商峁┳銐虻臄?shù)據(jù)參數(shù)。比如,“文心一言”背后有百度的海量搜索數(shù)據(jù)和語(yǔ)料庫(kù);阿里的“通義千問(wèn)”則有來(lái)自電商、云計(jì)算等領(lǐng)域的語(yǔ)料庫(kù)。
最后,互聯(lián)網(wǎng)大廠豐富的應(yīng)用場(chǎng)景和大模型十分貼近,可以讓AI大模型的落地變得更容易?;ヂ?lián)網(wǎng)大廠分別來(lái)自電商、社交、游戲、教育等諸多行業(yè),并且擁有面向用戶的多個(gè)產(chǎn)品和服務(wù),如百度和360的搜索、騰訊的社交媒體、阿里的云計(jì)算和電商等,其主營(yíng)業(yè)務(wù)十分貼近大模型應(yīng)用場(chǎng)景,而基于其原有業(yè)務(wù)在資源和技術(shù)上的積累,這些互聯(lián)網(wǎng)大廠則是最有機(jī)會(huì)推動(dòng)模型技術(shù)向C端用戶普及的玩家。
科技公司技術(shù)作保
在互聯(lián)網(wǎng)大廠積極布局AI大模型之時(shí),科技公司的身影也異?;钴S。商湯科技宣布推出了“日日新”大模型體系;昆侖萬(wàn)維和奇點(diǎn)智源合作自研了大語(yǔ)言模型“天工”;科大訊飛也發(fā)布了“星火”大模型。而科技公司之所以能夠爭(zhēng)先恐后地推出自己的AI大模型方案和發(fā)展計(jì)劃,則與其自身強(qiáng)大的底氣不無(wú)關(guān)系。
一方面,科技公司在AI大模型的應(yīng)用探索上已取得了一定的先發(fā)優(yōu)勢(shì),這有助其率先搶占用戶心智。憑借超前的戰(zhàn)略眼光,大多數(shù)科技公司多年前便已展開(kāi)了人工智能技術(shù)在各業(yè)務(wù)領(lǐng)域的應(yīng)用探索,并將相關(guān)技術(shù)全面應(yīng)用到旗下社交娛樂(lè)、信息分發(fā)等業(yè)務(wù)板塊,且現(xiàn)已取得一定的先發(fā)優(yōu)勢(shì)。比如,昆侖萬(wàn)維在2020年就已經(jīng)開(kāi)始領(lǐng)先布局AIGC,耕耘三年,如今發(fā)布的“天工”3.5也被其自稱為將是“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國(guó)產(chǎn)大語(yǔ)言模型”。
另一方面,科技公司在人工智能等技術(shù)上有著深厚積累,可以為AI大模型的落地提供強(qiáng)有力的技術(shù)支撐。包括商湯科技、科大訊飛等在內(nèi)的科技公司早在ChatGPT火爆之前,就有了大量關(guān)于人工智能的積累。比如,作為國(guó)內(nèi)領(lǐng)先的人工智能企業(yè),科大訊飛不但擁有豐富的AI技術(shù)積累和經(jīng)驗(yàn),目前還建有業(yè)界一流的AI數(shù)據(jù)中心。而憑借在AI技術(shù)領(lǐng)域的巨大優(yōu)勢(shì),這些科技公司更有可能做出真正意義上的類ChatGPT的自然語(yǔ)言生成的大模型。
另外,科技公司在AI技術(shù)應(yīng)用上的商業(yè)化落地經(jīng)驗(yàn),能為其AI大模型商業(yè)化落地提供借鑒。由于在AI領(lǐng)域的長(zhǎng)期積累,大多數(shù)科技公司已經(jīng)通過(guò)建立技術(shù)優(yōu)勢(shì),以及AI產(chǎn)業(yè)化實(shí)現(xiàn)了盈利反哺技術(shù)研發(fā),形成了可持續(xù)發(fā)展的商業(yè)模式。比如“AI四小龍”之一的商湯科技,就有著超過(guò)20年的AI原創(chuàng)技術(shù),并且其領(lǐng)先的AI技術(shù)正不斷落地在生活場(chǎng)景中。而隨著其AI技術(shù)應(yīng)用逐漸規(guī)?;涞?,其商業(yè)化也在隨之加速。
創(chuàng)業(yè)企業(yè)洞察力為憑
在互聯(lián)網(wǎng)大廠和科技公司開(kāi)卷之際,創(chuàng)業(yè)公司也在AI大模型的風(fēng)口中找到了機(jī)會(huì),又為這一領(lǐng)域添了一把火。原美團(tuán)聯(lián)合創(chuàng)始人王慧文的一則“AI英雄榜”,宣布高調(diào)入局“劍指”大模型;隨后,前搜狗CEO王小川、前京東AI掌門人周伯文、被譽(yù)為“AI框架領(lǐng)域第一華人”的阿里技術(shù)副總裁賈揚(yáng)清等一眾大佬也爭(zhēng)先加入了AI大模型的創(chuàng)業(yè)隊(duì)伍。而這些創(chuàng)業(yè)企業(yè)之所以能夠成為殺向大模型賽道的一匹黑馬,當(dāng)然還是得益于其得天獨(dú)厚的優(yōu)勢(shì)。
一是,初創(chuàng)企業(yè)更敏銳,能夠快速洞悉AI大模型的市場(chǎng)需求并展開(kāi)相應(yīng)業(yè)務(wù)?;ヂ?lián)網(wǎng)時(shí)代競(jìng)爭(zhēng)激烈,各企業(yè)都在搶占市場(chǎng)盲點(diǎn),想要憑借先發(fā)優(yōu)勢(shì)占得市場(chǎng)份額的高點(diǎn)。相比較而言,初創(chuàng)企業(yè)往往具有更敏銳的市場(chǎng)洞察力,能夠迅速發(fā)現(xiàn)市場(chǎng)中未被充分滿足的需求,也更容易適應(yīng)市場(chǎng)需求并做出戰(zhàn)略調(diào)整,從而推出具有獨(dú)特性和優(yōu)勢(shì)的產(chǎn)品和服務(wù)。
二是,初創(chuàng)企業(yè)更靈活,可以基于大模型進(jìn)行“再開(kāi)發(fā)”,以挖掘新的交易機(jī)會(huì)。由于初創(chuàng)企業(yè)往往充滿探索精神,因此其可以選擇的商業(yè)模式也更為多樣化,除了利用AI大模型為自己打工,AI創(chuàng)業(yè)者們還能基于大模型進(jìn)行“再開(kāi)發(fā)”,尤其是一些基于AI大模型發(fā)展的垂直應(yīng)用場(chǎng)景,也有可能成為企業(yè)新的增長(zhǎng)機(jī)會(huì)。比如,使用文心一言大模型,基于其語(yǔ)音和文本處理功能,開(kāi)發(fā)者可以再增加線上記賬小模型,用語(yǔ)音輸入實(shí)現(xiàn)實(shí)時(shí)記賬。
三是,初創(chuàng)企業(yè)更專注,有足夠的時(shí)間和精力去研究和開(kāi)發(fā)出AI大模型更多的場(chǎng)景和功能。眾所周知,無(wú)論是互聯(lián)網(wǎng)大廠還是科技巨頭,往往都有著多條業(yè)務(wù)線,因此,各項(xiàng)資源就會(huì)比較分散,而作為其若干個(gè)業(yè)務(wù)中的一個(gè),大模型領(lǐng)域能被分到的資源就十分有限。相比較而言,初創(chuàng)企業(yè)更專注于一項(xiàng)業(yè)務(wù),會(huì)通過(guò)聚焦產(chǎn)品本身進(jìn)行深度思考,從而精準(zhǔn)挖掘用戶需求,設(shè)計(jì)出讓用戶滿意的產(chǎn)品,讓用戶更愿意為之買單。
有門道,更有門檻
為了追逐AI大模型的浪潮,無(wú)論是互聯(lián)網(wǎng)大廠,還是科技公司,亦或是初創(chuàng)企業(yè),無(wú)一不都亮出了絕招。國(guó)內(nèi)的AI大模型已然遍地開(kāi)花了,至于誰(shuí)會(huì)成為最后的贏家,目前雖尚無(wú)定論,但值得注意的是,每一個(gè)狂熱賽道的背后往往不乏擔(dān)憂,而追逐大模型的玩家自然也都面臨著共同的難題。
一來(lái),AI大模型在算力、算法等核心技術(shù)方面都還不太完善,還有很大的進(jìn)步空間。在AI時(shí)代,生產(chǎn)力的三要素分別是應(yīng)用場(chǎng)景、專有數(shù)據(jù)和基礎(chǔ)模型。然而,大模型技術(shù)應(yīng)用范圍雖然廣泛,但目前落地的場(chǎng)景卻比較有限。而且當(dāng)前國(guó)內(nèi)算力稀缺、數(shù)據(jù)模型訓(xùn)練不足,甚至版權(quán)糾紛等問(wèn)題依舊難以忽視。更何況,本身缺乏核心技術(shù)、套用別家公司硬件或數(shù)據(jù)庫(kù)來(lái)預(yù)訓(xùn)練參數(shù)的也不在少數(shù),可見(jiàn),國(guó)產(chǎn)大模型還有很長(zhǎng)的一段路要走。
二來(lái),AI大模型頂級(jí)的技術(shù)人才是稀缺資源,各玩家之間的搶人大戰(zhàn)將難以避免。隨著大模型越來(lái)越火熱,高精尖的技術(shù)人才就成了兵家必爭(zhēng)之地,大廠們更是毫不吝嗇地開(kāi)出百萬(wàn)年薪來(lái)爭(zhēng)奪。根據(jù)脈脈發(fā)布的《AIGC?才趨勢(shì)報(bào)告》顯示,自O(shè)penAI推出的2021年以來(lái),對(duì)于AIGC相關(guān)人才的爭(zhēng)奪就已經(jīng)開(kāi)始了。2021年1-2月,AIGC相關(guān)崗位招聘同比上升281.88%;2022年和今年的1-2月,招聘數(shù)量分別保持了76.74%和31.3%的同比增幅。
三來(lái),AI大模型目前的落地場(chǎng)景還較為有限,商業(yè)化想要徹底跑通恐怕還需要時(shí)間。無(wú)論是對(duì)哪個(gè)行業(yè)而言,商業(yè)化都是極為難過(guò)的一關(guān)。即便是技術(shù)領(lǐng)跑全行業(yè)的openAI,在商業(yè)化方面也有著不小的煩惱,比如,openAI的估值雖然隨著ChatGPT的走紅而一路高升,但每一次預(yù)訓(xùn)練參數(shù)都要耗費(fèi)巨資,因此其虧損也在持續(xù)擴(kuò)大。其他玩家的商業(yè)化嘗試恐怕也是收效甚微,短時(shí)間內(nèi)幾乎不可能覆蓋預(yù)訓(xùn)練所需成本。
總而言之,對(duì)所有參與的玩家來(lái)說(shuō),大模型無(wú)疑是一場(chǎng)艱苦的馬拉松競(jìng)賽。而且,隨著國(guó)內(nèi)各種大模型接踵而至,“百模大戰(zhàn)”也已經(jīng)正式打響,留給參與者們的時(shí)間似乎并不算多了。而待到潮水消退,國(guó)內(nèi)的AI大模型玩家們恐怕只有堅(jiān)持做自己,才能夠在這場(chǎng)競(jìng)賽中走得更長(zhǎng)遠(yuǎn)些。