文|深眸財經(jīng) 張未
AI大模型的戰(zhàn)場正在分化。
Chatgpt作為導(dǎo)火索,打開了AI2.0時代的大門,而AI2.0的特征便是“產(chǎn)業(yè)智能化、數(shù)字化”,能夠高效地替代人工,廣泛地運用到各行各業(yè),所以比起還在探索落地、已過了狂奔期的元宇宙,AI大模型的落地來得更實在些。
最典型的表現(xiàn)就是,AI大模型的出圈更廣泛,不止步于B端。比如,即便chatGPT發(fā)布半年有余,筆者在上海CBD樓下的咖啡廳還能聽到打工人談?wù)揷hatGPT的聲音;據(jù)媒體報道,也有部分企業(yè)將AIGC作為生產(chǎn)力工具。
正如阿里巴巴集團(tuán)董事會主席兼CEO、阿里云智能集團(tuán)CEO張勇所說:面向AI時代,所有產(chǎn)品都值得用大模型重做一次。
大廠、科研機構(gòu)和創(chuàng)業(yè)者,紛紛下場。
大廠有百度文心一言、華為盤古、360智腦、商湯日日新、阿里通義千問、京東靈犀、昆侖萬維天工等大模型先后登場,后續(xù)還有騰訊混元、科大訊飛星火等大模型排隊等著上線。
創(chuàng)業(yè)者也不乏名人,搜狗創(chuàng)始人王小川、美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場董事長李開復(fù)等人高調(diào)入場AI大模型。
持續(xù)了幾月有余的AI大模型熱,衍生出了兩條道路。
01 AI軍備競賽,大模型分化
AI大模型已經(jīng)進(jìn)入了競賽階段,并且路徑逐漸分化。
隨著AI大模型逐漸加熱,有媒體統(tǒng)計,2月初,東方財富上“ChatGPT”板塊還只有29只股票,如今已經(jīng)達(dá)到61支,數(shù)量還在不斷攀升中。 據(jù)不完全統(tǒng)計,截至目前,我國已有超過40家公司、機構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計劃。
在其中,參與AI大模型這場“軍備競賽”的玩家們也發(fā)展出了兩個發(fā)展方向。垂直大模型和通用大模型,正成為目前人工智能領(lǐng)域的兩個主要發(fā)展方向。
垂直大模型是指針對特定領(lǐng)域或任務(wù)進(jìn)行優(yōu)化設(shè)計的模型,例如語音識別、自然語言處理、圖像分類等。
當(dāng)前有越來越多的企業(yè)加入垂直大模型的賽道。學(xué)而思宣布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā),命名為MathGPT,面向全球數(shù)學(xué)愛好者和科研機構(gòu);5月6日,淘云科技宣布推出兒童認(rèn)知大模型——阿爾法蛋兒童認(rèn)知大模型,為孩子在練表達(dá)、塑情商、啟創(chuàng)造、助學(xué)習(xí)等方面帶來全新交互體驗。
通用大模型是指能夠處理多種任務(wù)和領(lǐng)域的模型,例如BERT、GPT等。
由于資金、人才等優(yōu)勢,大廠主要瞄準(zhǔn)通用大模型這個賽道。
大廠瞄準(zhǔn)通用大模型一方面是能夠?qū)I的能力與自身產(chǎn)品結(jié)合,比較有代表性的就是阿里、華為、百度等互聯(lián)網(wǎng)大廠和科技巨頭。
比如,繼微軟把GPT-4整合進(jìn)Office全家桶后,阿里“通義千問”也開始接入釘釘,用戶可以在文檔生成內(nèi)容,在視頻會議中能以參會者為單位,生成每個人的觀點和內(nèi)容。
像是百度的大模型也能結(jié)合自身業(yè)務(wù),“文心一言”在對搜索引擎的迭代上能夠有質(zhì)的蛻變,能夠從用戶尋找答案,轉(zhuǎn)換為回答用戶問題,包括騰訊“混元”、網(wǎng)易“玉言”、京東“ChatJD”均能夠優(yōu)先應(yīng)用于自身產(chǎn)業(yè)。
另一方面,通用性大模型的適用性較廣,先跑贏者能夠建立起先發(fā)優(yōu)勢,成為AI2.0時代的領(lǐng)路人。畢竟,“跑得快的有肉吃,跑得慢的只能吃剩下的邊角料”,這個道理誰都懂。
垂直應(yīng)用大模型可謂是一股“清流”,由于垂直應(yīng)用大模型更符合垂類場景的需求、質(zhì)量比通用大模型更高,也讓眾多企業(yè)看到了其中的機會。比如深蘭、出門問問、有道等聚焦AI具體賽道的企業(yè)。
垂直大模型的發(fā)展主要體現(xiàn)在各個領(lǐng)域的模型性能持續(xù)提升,例如語音識別的錯誤率逐年下降,自然語言處理的語義理解能力不斷提升等。通用大模型則在多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)等方面取得了顯著進(jìn)展,已經(jīng)成為自然語言處理領(lǐng)域的重要研究方向。
比如,生物大模型能夠提高AI制藥效率。國外的研究報告顯示,ai可以將新藥研發(fā)的成功率提高16.7%,ai輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費用,并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時間成本。根據(jù)英偉達(dá)公開資料,使用ai技術(shù)可使藥物早期發(fā)現(xiàn)所需時間縮短至三分之一,成本節(jié)省至兩百分之一。
在產(chǎn)業(yè)角度來看,通用模型就是“百科全書”,能夠有問必答,能夠適用不同的產(chǎn)業(yè)土壤,而垂直模型類似于單領(lǐng)域的專家,雖然專業(yè),但受眾注定是少數(shù)人。
02 數(shù)據(jù)是致命傷
垂直大模型的優(yōu)勢在于不夠“大”:算力不夠大、算法難度低。
王小川在入局大模型賽道后,就一直強調(diào)未來發(fā)力的方向并不是像OpenAI一樣去做AGI(通用人工智能),而是垂直在某些特定的領(lǐng)域去做大模型,并實現(xiàn)落地應(yīng)用。
廣義上的大模型實際上是形容通用大模型,正如“大”模型之稱,大模型之所以“大”,就是因為參數(shù)眾多和數(shù)據(jù)量龐大,對算法、算力、數(shù)據(jù)存儲空間都有極大的要求,而這些不只是人才可以彌補的,還需要大量的資金。要知道,Open AI的成功也是微軟當(dāng)初用數(shù)十億美金堆出來的。巨大的資金需求,對大廠的研發(fā)決心也是一種考驗。
過去5年,AI大模型的參數(shù)量幾乎每年提升一個數(shù)量級,例如GPT-4參數(shù)量是GPT-3的16倍,達(dá)到1.6萬億個;而隨著圖像、音視頻等多模態(tài)數(shù)據(jù)的引入,大模型的數(shù)據(jù)量也在飛速膨脹。這意味著想要玩轉(zhuǎn)大模型,必須擁有大算力。
做垂直大模型的企業(yè),對比大廠來說,資金、算力、數(shù)據(jù)較為匱乏,所以實際上和通用大模型玩家不在同一條起跑線上。
正如新能源車離不開電機、電池、電控這三大件,AI大模型則離不開算力、算法和數(shù)據(jù)的支持。
在算力、算法和數(shù)據(jù)中,數(shù)據(jù)是垂直大模型的難點。
三要素中,算法的研發(fā)難度相對較低,當(dāng)前的公司都有自己實現(xiàn)大模型的路徑算法,且有眾多開源項目可參考。
芯片決定算力,AI大模型整體需要較高性能的芯片完成對整體模型神經(jīng)網(wǎng)絡(luò)的訓(xùn)練建構(gòu),而當(dāng)前的芯片自研較少,還是以外采為主,像當(dāng)前最適應(yīng)ChatGPT的芯片就來自英偉達(dá)的旗艦芯片H100和次旗艦芯片A100。
難點在于數(shù)據(jù)。高質(zhì)量的數(shù)據(jù)是助力AI訓(xùn)練與調(diào)優(yōu)的關(guān)鍵,足夠多、足夠豐富的數(shù)據(jù),是生成式AI大模型的根基。
據(jù)OpenAI此前披露,僅ChatGPT3參數(shù)數(shù)量已達(dá)到1750億,訓(xùn)練資料達(dá)到45TB。
由于中國移動互聯(lián)網(wǎng)發(fā)展較為成熟,大量中文數(shù)據(jù)資源被存于各家企業(yè)或機構(gòu)里,較難共享。
“由于企業(yè)的很多業(yè)務(wù)數(shù)據(jù)、物流數(shù)據(jù)、財務(wù)數(shù)據(jù)等都是非常核心的私域數(shù)據(jù),很難想象華星光電或者是中石油會把數(shù)據(jù)拿給人家去訓(xùn)練?!眲?chuàng)新奇智CEO徐輝近日受證券時報采訪時也曾直言。
以AI制藥行業(yè)為例,生物大模型就面對被技術(shù)“卡脖子”的問題。藥物研發(fā)對高精度實驗數(shù)據(jù)獲取成本較高,且公開數(shù)據(jù)庫中有大量無標(biāo)注數(shù)據(jù),既要利用好大量無標(biāo)注數(shù)據(jù),又要利用好少量高精度數(shù)據(jù),所以對模型建構(gòu)提出了較高要求。
03 誰先賺到第一桶金?
無論何種模式,商業(yè)化都是核心問題。從目前擁有大模型的AI玩家來看,都在快速推進(jìn)賦能和商業(yè)化。
通用大模型和垂類大模型,雖走的路不同,但本質(zhì)還是“一家人”,處于同一個賽道中,所以避免不了競爭這個問題。
對于通用大模型而言,垂直大模型先落地,通用大模型的路會更窄。同樣,通用大模型先快速搶占市場后,業(yè)務(wù)線較窄的垂直大模型,要想賺錢就更為艱難。
在理想階段中,通用大模型無論是經(jīng)濟(jì)模型,還是普世價值,都是要優(yōu)于垂直大模型的??墒?,現(xiàn)實生活不是烏托邦,通用大模型和垂類大模型誰跑得更快,還得看各企業(yè)之間的比拼。
從去年大熱的AIGC來看。相比在C端讓用戶以較低的門檻使用AI生成內(nèi)容,B端被部分市場人士認(rèn)為將是AIGC更主要的商業(yè)模式。
華為也更注重于自己的ToB業(yè)務(wù)。在發(fā)布會上,華為表示,華為盤古大模型主要以AI賦能產(chǎn)業(yè),運用在電力、金融、農(nóng)業(yè)等多個行業(yè),其中CV大模型落地礦山,NLP大模型落地智能文檔檢索。
像是以搜索引擎為所長的百度,推出了類似GPT-3這樣具備搜索屬性的文心一言。
除了ChatGPT,實際上在AI大模型這陣風(fēng)吹起來之前就已有落地的場景了,這些“大”模型,實際以垂直大模型為主。
語言模型:如GPT、BERT等,主要應(yīng)用于自然語言處理領(lǐng)域,如機器翻譯、文本生成、情感分析等。
圖像模型:如ResNet、Inception等,主要應(yīng)用于計算機視覺領(lǐng)域,如圖像分類、目標(biāo)檢測、圖像分割等。
推薦模型:如DNN、RNN等,主要應(yīng)用于推薦系統(tǒng)領(lǐng)域,如商品推薦、廣告推薦等。
聊天機器人:如Seq2Seq、Transformer等,主要應(yīng)用于智能客服、智能助手等場景。
金融風(fēng)控:如XGBoost、LightGBM等,主要應(yīng)用于銀行、證券等金融機構(gòu)的風(fēng)控場景,如信用評分、反欺詐等。
醫(yī)療影像診斷:如DeepLung、DeepLesion等,主要應(yīng)用于醫(yī)療影像診斷領(lǐng)域,如肺癌診斷、病理學(xué)分析等。
比起落地,更重要的是賺錢。
據(jù)國盛證券報告《ChatGPT 需要多少算力》估算,GPT-3 訓(xùn)練一次的成本約為 140 萬美元,對于一些更大的 LLM(大型語言模型),訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 在 1 月的獨立訪客平均數(shù) 1300 萬計算,其對應(yīng)芯片需求為 3 萬多片英偉達(dá)A100 GPU,初始投入成本約為 8 億美元,每日電費在 5 萬美元左右。
通用大模型在落地場景更廣泛毋庸置疑,對于有底氣地通用大模型的玩家來說,商業(yè)化是其次,垂直類大模型,需要更快的商業(yè)化來兜底,所以垂直大模型的落地有更高的可能性和更快地普及速度。
誰能先形成絕對優(yōu)勢還沒有肯定的答案。AI大模型的這場“軍備競賽”,正如web1向web2的蝶變,企業(yè)爭分奪秒地向前跑,誰先抓住了機會,就抓住了市場。