正在閱讀:

大廠混戰(zhàn)大模型:四大流派,各有所長(zhǎng)

掃一掃下載界面新聞APP

大廠混戰(zhàn)大模型:四大流派,各有所長(zhǎng)

一文讀懂大廠大模型。

文|定焦 溫故

編輯 | 方展博

今年以來(lái),整個(gè)科技圈最熱鬧的事情,是發(fā)布大模型。

從3月百度率先發(fā)布文心一言以來(lái),阿里、科大訊飛、360、騰訊紛紛跟上。7月,華為、京東、攜程也召開(kāi)發(fā)布會(huì),雖遲但到。

科技公司又卷起來(lái)了。以至于某頭部互聯(lián)網(wǎng)大廠的技術(shù)負(fù)責(zé)人,在一場(chǎng)發(fā)布會(huì)開(kāi)場(chǎng)就強(qiáng)調(diào):“今天不會(huì)發(fā)布預(yù)訓(xùn)練多模態(tài)大模型,今天也不會(huì)蹭大模型的熱點(diǎn)?!?/p>

7月17日下午,在攜程發(fā)布旅游行業(yè)垂直大模型后,除了極個(gè)別藏著掖著的互聯(lián)網(wǎng)大廠,大廠大模型基本集結(jié)完畢。

中國(guó)大廠大模型發(fā)布時(shí)間線 制圖 / 定焦

大模型越來(lái)越多,雖出自大廠,但真假難辨。大家的招數(shù)也不同,有的迷戀“作詩(shī)”,有的埋頭“做事”,還有的“講故事”。

根據(jù)資源能力、布局深度、出招套路,大廠的大模型可以分為不同的流派?!付ń埂箤⑺鼈兛偨Y(jié)為四大類型:

全能型:百度、阿里、騰訊、華為

業(yè)務(wù)型:京東、字節(jié)跳動(dòng)、科大訊飛

探索型:360、網(wǎng)易、攜程

觀望型:美團(tuán)、小米

業(yè)界普遍認(rèn)為,第一梯隊(duì)當(dāng)屬百度、阿里、騰訊、華為四家,它們的綜合實(shí)力最強(qiáng)。京東、字節(jié)跳動(dòng)、科大訊飛位列第二梯隊(duì),業(yè)務(wù)屬性較重;360、攜程、網(wǎng)易還在探索階段;美團(tuán)、小米還沒(méi)有發(fā)布大模型。

當(dāng)然,這個(gè)分類是動(dòng)態(tài)的。行業(yè)變化太快,大廠的進(jìn)展也是一日千里,格局隨時(shí)可能改寫(xiě)。

接下來(lái),「定焦」就帶大家探討一下,大廠的大模型都長(zhǎng)啥樣,哪家的大模型最強(qiáng),以及,大廠大模型,拼什么?

兩條路線,三個(gè)層級(jí)

在討論大廠大模型之前,我們先做一個(gè)背景科普。

首先,大模型不是新鮮事物。它不是突然蹦出來(lái)的,只是被ChatGPT帶火了。在去年11月底ChatGPT問(wèn)世之前,百度、阿里、騰訊、華為等大廠就有自己的大模型,而且經(jīng)常在一些國(guó)際測(cè)評(píng)類榜單中刷榜。

具體到大模型的類別,有兩條大的路線,一是通用,二是垂直。

所謂“通用”,可以簡(jiǎn)單理解為大模型啥都會(huì);“垂直”,是在某個(gè)特定領(lǐng)域做的特別好。這其中的差別,就像一個(gè)高中生畢業(yè)了,基本的能力素養(yǎng)都有,但沒(méi)啥專業(yè)性;另一個(gè)是職高畢業(yè),綜合能力差點(diǎn),但可能工地搬磚有一手,或修車修的好。

ChatGPT,以及百度文心一言、阿里通義千問(wèn),都是通用大模型,能聊天、寫(xiě)詩(shī)、作畫(huà),看起來(lái)比較全能。但你要讓它去做專業(yè)的在線問(wèn)診、物流規(guī)劃,可能做得很一般。

與之對(duì)應(yīng),像華為推出的礦山大模型、實(shí)時(shí)預(yù)測(cè)全球海浪的大模型,以及京東金融行業(yè)大模型,主打的就是“做事”和“專業(yè)”。

這兩條路線,是我們理解大模型的基礎(chǔ),也決定了大廠在布局大模型賽道時(shí)的戰(zhàn)略方向。

那么,不論是通用大模型還是垂直大模型,企業(yè)具體能做什么?

百度創(chuàng)始人兼CEO李彥宏曾給過(guò)創(chuàng)業(yè)公司一個(gè)建議:沒(méi)有必要再重新做基礎(chǔ)大模型,創(chuàng)業(yè)者的機(jī)會(huì)是在應(yīng)用層,將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機(jī)遇”。

先拋開(kāi)這個(gè)觀點(diǎn)的立場(chǎng),這里提到了“基礎(chǔ)大模型”和“應(yīng)用層”。這就涉及到大模型的三個(gè)層級(jí)。

中國(guó)大模型的創(chuàng)業(yè)生態(tài),玩家都在不同層級(jí)進(jìn)行站位——架構(gòu)層、模型層、應(yīng)用層。

架構(gòu)層的進(jìn)入門(mén)檻最高,功能有點(diǎn)類似基礎(chǔ)設(shè)施,能參與進(jìn)來(lái)的主要是各大云計(jì)算廠商,比如阿里、騰訊、百度、華為這四巨頭。

模型層的一大重點(diǎn)是基礎(chǔ)大模型,對(duì)算力、算法、數(shù)據(jù)、人才的要求非常高,一般的創(chuàng)業(yè)公司做不了。有一些公司選擇在基礎(chǔ)大模型之上做一些微調(diào),針對(duì)性推出行業(yè)大模型。

應(yīng)用層是基于前兩類大模型,調(diào)用API開(kāi)發(fā)應(yīng)用,就像手機(jī)行業(yè)基于安卓和iOS開(kāi)發(fā)APP,這是大部分創(chuàng)業(yè)公司能做的事情。大眾熟知的ChatGPT,其實(shí)是OpenAI對(duì)GPT-3模型微調(diào)后開(kāi)發(fā)出來(lái)的對(duì)話機(jī)器人應(yīng)用。

中國(guó)的科技公司在布局時(shí),尤其是BAT這樣的超級(jí)巨頭,往往會(huì)交叉覆蓋三大層級(jí)?;A(chǔ)打法是先發(fā)布通用大模型或者行業(yè)大模型底座,其他公司再基于這些基礎(chǔ)模型,結(jié)合自身?yè)碛械男袠I(yè)數(shù)據(jù),微調(diào)出自己的大模型應(yīng)用。

因?yàn)镃hatGPT的火爆,很多人將大模型理解為一個(gè)應(yīng)用或一款產(chǎn)品,是不太準(zhǔn)確的。大模型正在形成一個(gè)生態(tài),這其中有修高速公路的,有蓋房子的,還有搞精裝修的。

有野心的頭部大廠想拿下壁壘最高、賽道最寬闊的架構(gòu)層和模型層,但難度和風(fēng)險(xiǎn)系數(shù)極大,很可能投入之后看不到成果。中部大廠更多選擇在一些垂直行業(yè)深耕,先在具體場(chǎng)景落地,看到效果之后再加大投入。更多的大廠其實(shí)還在探索階段,一邊觀望一邊行進(jìn),摸著石頭過(guò)河。

大廠的招式與武功

隨著互聯(lián)網(wǎng)大廠陸續(xù)發(fā)布大模型,大廠們的布局逐漸清晰起來(lái)。

我們將百度、阿里、騰訊、華為歸入一梯隊(duì),一是因?yàn)樗麄冊(cè)诖竽P蜕掀鸩皆纾季稚?,二是因?yàn)槟芰θ妗?/p>

百度是國(guó)內(nèi)第一個(gè)推出聊天機(jī)器人產(chǎn)品,開(kāi)放內(nèi)測(cè),硬剛ChatGPT的公司。

再把時(shí)間往前推四年,百度在2019年3月就對(duì)標(biāo)谷歌BERT模型,推出了文心大模型ERNIE 1.0,中文效果超越BERT。這個(gè)模型在2021年12月參數(shù)達(dá)千億,跨入“智能涌現(xiàn)”門(mén)檻。ERNIE 3.0 Zeus也是國(guó)內(nèi)首個(gè)開(kāi)放API調(diào)用的千億大模型。

阿里在今年4月11日發(fā)布對(duì)標(biāo)ChatGPT的大語(yǔ)言模型通義千問(wèn),快速接入釘釘、天貓精靈,然后在3個(gè)月內(nèi)推出了聚焦音頻的大模型應(yīng)用通義聽(tīng)悟,以及AI繪畫(huà)大模型通義萬(wàn)相,通義大模型家族日漸成型。

如此快節(jié)奏,是因?yàn)榘⒗锇褱?zhǔn)備工作做到位了。阿里很早就發(fā)布了語(yǔ)言大模型Plug和多模態(tài)大模型M6,M6在2021年10月參數(shù)規(guī)模達(dá)10萬(wàn)億,是當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。這兩個(gè)模型在去年9月合并,發(fā)展為今天的通義大模型。

騰訊直到今年6月下旬才召開(kāi)發(fā)布會(huì),是大廠中相對(duì)較晚的一個(gè),而且它沒(méi)有像百度、阿里一樣發(fā)布通用大模型,而是面向B端客戶發(fā)布了行業(yè)大模型解決方案。華為也是一樣,它在7月7日發(fā)布面向行業(yè)的盤(pán)古大模型3.0,沒(méi)有發(fā)布聊天機(jī)器人。

騰訊和華為的硬實(shí)力都很強(qiáng)。騰訊在去年4月發(fā)布了混元大模型,這是一個(gè)集計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理于一體的多模態(tài)大模型,已經(jīng)在騰訊各大業(yè)務(wù)模塊中應(yīng)用。華為的盤(pán)古大模型早在2021年4月就發(fā)布了,還落地了一些具體的場(chǎng)景。

這波AI2.0浪潮,很多能力都是建立在云平臺(tái)之上。不論是算力、模型,還是工具鏈,都是通過(guò)云平臺(tái)對(duì)外輸出。在此基礎(chǔ)上,大公司建設(shè)大模型生態(tài),支撐更多應(yīng)用生長(zhǎng),是一套比較高級(jí)的打法,目前能玩轉(zhuǎn)的也就這四家大廠。

二梯隊(duì)的京東、字節(jié)跳動(dòng)、科大訊飛,我們將之歸入“業(yè)務(wù)型”選手,因?yàn)樗麄兊哪芰?cè)重模型層,更看中跟業(yè)務(wù)結(jié)合。

比如京東,7月13日京東推出AI大模型“言犀”,這是一個(gè)面向產(chǎn)業(yè)的垂直大模型,側(cè)重解決真實(shí)場(chǎng)景的實(shí)際問(wèn)題。過(guò)去這些年京東除了在電商賣貨,物流、金融、健康等業(yè)務(wù)也發(fā)展起來(lái)了,所以“言犀”大模型一開(kāi)始主要面向零售、金融、城市、健康和物流領(lǐng)域。早期自用為主,后期向外部客戶開(kāi)放。

再比如科大訊飛?!靶腔鹫J(rèn)知大模型”在5月6日發(fā)布,同時(shí)發(fā)布的還有其在教育、辦公、汽車、數(shù)字員工方向的落地應(yīng)用,還將接入學(xué)習(xí)機(jī)、錄音轉(zhuǎn)寫(xiě)工具“訊飛聽(tīng)見(jiàn)”等產(chǎn)品。

字節(jié)跳動(dòng)的玩法比較特別,它在6月28日發(fā)布了“火山方舟”。注意,這不是大模型,官方說(shuō)法是“企業(yè)級(jí)大模型服務(wù)平臺(tái)”。簡(jiǎn)言之就是一個(gè)大模型超市,字節(jié)不生產(chǎn)大模型,只“搬運(yùn)”大模型。

這三家大廠,在做業(yè)務(wù)方面都很有一手。對(duì)他們而言,大模型更多是一個(gè)工具,先在自己內(nèi)部跑通,把效率提上來(lái),看到實(shí)實(shí)在在的效果后,再考慮加大投入推廣。

三梯隊(duì)的360、網(wǎng)易、攜程,大模型還在探索階段。

這其中360可能不服氣,自從ChatGPT火了之后,低調(diào)了很久的“紅衣教主”周鴻祎突然又活躍起來(lái),頻頻發(fā)表言論。已經(jīng)包裝成“數(shù)字安全公司”的360,在6月13日發(fā)布“360智腦大模型”和一款數(shù)字人產(chǎn)品。

不過(guò),雖然產(chǎn)品功能豐富,但外界對(duì)360大模型的技術(shù)水平存疑。360自稱前期在AIGC技術(shù)一直有投入,去年還發(fā)起了計(jì)劃投資總額2.23億元的項(xiàng)目,半年過(guò)去了,募來(lái)的錢只投了5%。

攜程和網(wǎng)易在大模型上的布局,目前還不是很系統(tǒng)。網(wǎng)易聲稱從2021年開(kāi)始打造“玉知”多模態(tài)理解大模型,借助了華為昇騰AI的力量,在行業(yè)里存在感不強(qiáng)。攜程發(fā)布旅游行業(yè)垂直大模型“攜程問(wèn)道”,出發(fā)點(diǎn)是提升內(nèi)部各大業(yè)務(wù)的工作效率。

美團(tuán)和小米沒(méi)有發(fā)布大模型,但內(nèi)部已經(jīng)啟動(dòng)相關(guān)項(xiàng)目。美團(tuán)最新的動(dòng)態(tài)是接盤(pán)王慧文的光年之外,這對(duì)美團(tuán)的大模型業(yè)務(wù)實(shí)際有多大幫助,尚待觀察。

大廠大模型,拼什么?

這么多大模型,怎么評(píng)估好壞?

上半年的“百模大戰(zhàn)”中,中國(guó)大廠們?cè)谕瞥鲎约掖竽P蜁r(shí),都喜歡拿參數(shù)量說(shuō)事。ChatGPT已經(jīng)證明了大模型存在“涌現(xiàn)”現(xiàn)象,大模型的參數(shù)量越大,智能程度越高。

這是一個(gè)非常粗暴的指標(biāo)。阿里、百度等大廠幾年前就推出過(guò)萬(wàn)億參數(shù)的大模型,但參數(shù)大和能力強(qiáng)是兩回事。

另外一個(gè)常用的評(píng)價(jià)維度是公開(kāi)的評(píng)測(cè)集和榜單打分,中國(guó)的大廠非常喜歡參與。

比如騰訊,騰訊的混元大模型去年發(fā)布后,參加了很多榜單排名,在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模態(tài)視頻檢索數(shù)據(jù)集榜單中,先后取得第一名的成績(jī),實(shí)現(xiàn)了跨模態(tài)檢索領(lǐng)域的大滿貫,分?jǐn)?shù)更是打破多項(xiàng)紀(jì)錄。

百度的文心大模型,過(guò)去幾年也經(jīng)常登頂全球權(quán)威的GLUE榜單,甚至超過(guò)微軟、谷歌、OpenAI等公司。最近IDC發(fā)布了大模型評(píng)估報(bào)告,百度文心大模型在7項(xiàng)核心指標(biāo)上拿下滿分,綜合評(píng)分第一。

這個(gè)方式的局限性在于,會(huì)導(dǎo)致出現(xiàn)一些“應(yīng)試型選手”,測(cè)評(píng)分?jǐn)?shù)跟實(shí)際表現(xiàn)相差較遠(yuǎn)。

國(guó)內(nèi)一家AI創(chuàng)業(yè)公司的創(chuàng)始人季定宇對(duì)「定焦」說(shuō),“大模型是綜合能力的體現(xiàn),所有的測(cè)評(píng)都不能體現(xiàn)全部”,“在刷榜這件事上,大廠們就沒(méi)有輸過(guò)”。

當(dāng)一個(gè)新的風(fēng)口出現(xiàn)時(shí),創(chuàng)業(yè)者和資本一擁而上,導(dǎo)致信息差普遍存在。尤其是在早期階段,外界缺乏足夠的辨別力,這個(gè)時(shí)候誰(shuí)的聲量大,誰(shuí)就能獲得更高的關(guān)注度。

華為的盤(pán)古大模型推出兩年來(lái),普通人知之甚少。ChatGPT火了之后,盤(pán)古大模型迅速升級(jí)到3.0版本,并再次重磅向外界發(fā)布。

盛景嘉成董事總經(jīng)理劉迪對(duì)「定焦」說(shuō):“對(duì)于大廠而言,當(dāng)大家都在發(fā)布大模型時(shí),你是不能缺席的。因?yàn)镚PT的影響,大廠很被動(dòng)地將原來(lái)可能計(jì)劃在2-3年做的事情,壓縮到三個(gè)月快速地做出來(lái)?!?/p>

這就像一場(chǎng)賽跑,大家都在搶跑,顧不上姿勢(shì)和動(dòng)作是否優(yōu)雅。

對(duì)一些大廠而言,把什么產(chǎn)品、哪塊能力拿出來(lái)發(fā)布,是一道選擇題。大廠也要迎合熱點(diǎn)、造勢(shì)、包裝。開(kāi)發(fā)布會(huì)更多是一個(gè)宣傳行為,真正的功夫是在臺(tái)下,在幕后。

為了突出自身優(yōu)勢(shì),很多大廠會(huì)對(duì)標(biāo)GPT,用“在指標(biāo)前加定語(yǔ)”的方式來(lái)作對(duì)比,尤其是“中文能力”這項(xiàng)指標(biāo)。但目前,從C端用戶反饋來(lái)看,用戶量最大、體驗(yàn)最好的,依然是ChatGPT。

劉迪認(rèn)為,從商業(yè)模式上,大廠很難將大模型包裝成類似微信這種,大范圍使用的付費(fèi)C端產(chǎn)品,因?yàn)樗懔μ∪?。“現(xiàn)在的算力用來(lái)做微調(diào)和日常的B端業(yè)務(wù)處理都已經(jīng)很緊,C端的量一旦上來(lái),大廠支撐不住。

這導(dǎo)致的結(jié)果是,賣算力資源的云廠商,搶先一步吃到了大模型的紅利。

提前囤了超過(guò)1萬(wàn)張英偉達(dá)GPU的字節(jié)跳動(dòng),直到現(xiàn)在也沒(méi)有推出自己的大模型。在大廠發(fā)布大模型最熱鬧的4月,它旗下的算力平臺(tái)火山引擎,推出了自研DPU等系列云產(chǎn)品(DPU是一種定制化的加速硬件),支持萬(wàn)卡級(jí)大模型訓(xùn)練。

字節(jié)跳動(dòng)選擇為其他大模型公司提供算力服務(wù),雙方的關(guān)系就像微軟和OpenAI、亞馬遜和Bedrock。火山引擎總裁譚待稱,國(guó)內(nèi)大模型領(lǐng)域的數(shù)十家企業(yè),超過(guò)七成已經(jīng)在火山引擎云上。

綜合來(lái)看,大模型賽道還處在早期階段,大廠們雖然發(fā)布了產(chǎn)品,但搶跑的意味很濃。因?yàn)橘惖缐蜷L(zhǎng),一時(shí)的搶跑無(wú)法形成長(zhǎng)期優(yōu)勢(shì)。而且,行業(yè)變化迭代太快,技術(shù)、產(chǎn)品都可能隨時(shí)重新洗牌。

短暫的聲量之爭(zhēng)過(guò)后,才會(huì)進(jìn)入比拼硬實(shí)力的階段。

誰(shuí)最有可能勝出?

從年初至今,大家對(duì)大模型的認(rèn)識(shí)在逐漸發(fā)生變化。

年初,行業(yè)里的共識(shí)是,通用大模型是未來(lái)。大家覺(jué)得,通用大模型在各個(gè)場(chǎng)景都有很好表現(xiàn),可以解決一切問(wèn)題。大廠中,已經(jīng)發(fā)布類ChatGPT產(chǎn)品的有百度、阿里、科大訊飛、360。

后來(lái),大家發(fā)現(xiàn)這些產(chǎn)品更像是玩具。它們擅長(zhǎng)坐而論道,你跟它們聊天沒(méi)問(wèn)題,但要讓它們干具體的活,可能不太靠譜。

大廠迅速捕捉到了市場(chǎng)的變化。百度就發(fā)現(xiàn),文心一言發(fā)布后,一開(kāi)始來(lái)交流的企業(yè)都是CEO級(jí)別的人出面,后來(lái)大多是技術(shù)負(fù)責(zé)人或業(yè)務(wù)負(fù)責(zé)人。字節(jié)跳動(dòng)發(fā)現(xiàn),來(lái)找火山引擎的企業(yè),四五月份都是模型廠商,需求是訓(xùn)練模型,現(xiàn)在是一些行業(yè)客戶,希望在營(yíng)銷、客服等場(chǎng)景落地。

于是下半年,風(fēng)向變了。行業(yè)迅速達(dá)成新的共識(shí):行業(yè)大模型更靠譜,要從通用面向產(chǎn)業(yè)。大廠對(duì)外講故事的口徑也隨之變化,紛紛開(kāi)始發(fā)布行業(yè)大模型。

騰訊在6月下旬推出行業(yè)“精選模型商店”時(shí),騰訊云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生說(shuō),“聊天機(jī)器人不是唯一的大模型服務(wù)方式,也不一定是滿足行業(yè)需求的最優(yōu)解?!?/p>

華為7月上旬發(fā)布的盤(pán)古大模型3.0是面向行業(yè),華為常務(wù)董事、華為云CEO張平安稱,華為的盤(pán)古大模型不寫(xiě)詩(shī),要扎根于行業(yè),為各個(gè)行業(yè)帶來(lái)價(jià)值。

京東的“言犀”大模型定位直接就是面向產(chǎn)業(yè)。京東云事業(yè)部總裁曹鵬說(shuō),對(duì)話類的通用大模型不應(yīng)該是大模型的全部,大模型不應(yīng)該只是拿來(lái)聊天寫(xiě)詩(shī)作畫(huà)的玩具。

在diss通用大模型的同時(shí),這三家大廠開(kāi)始在“產(chǎn)業(yè)”上大做文章,凸顯自己的優(yōu)勢(shì)。他們的產(chǎn)品,均主要面向To B行業(yè)市場(chǎng)。

劉迪認(rèn)為,對(duì)于大廠而言,大模型有兩個(gè)價(jià)值,一是內(nèi)部做節(jié)流,把優(yōu)化的效率轉(zhuǎn)化成利潤(rùn);二是對(duì)外拓客,讓其他客戶賺到錢,大廠從中拿走合理的利潤(rùn)。最終一定要商業(yè)化?!皰侀_(kāi)技術(shù)指標(biāo),評(píng)價(jià)一個(gè)模型好不好用,就看用的人多不多。一看收費(fèi)客戶數(shù)量,二看創(chuàng)造的收入金額?!?/p>

MaaS模式(Models as a Service,模型即服務(wù))開(kāi)始被更多大廠搬到臺(tái)面上。去年的云棲大會(huì),以及今年的百度文心一言發(fā)布會(huì),都提到了這一概念。騰訊則公布了MaaS能力全景圖。

就像當(dāng)年的云計(jì)算市場(chǎng)一樣,底層算力和平臺(tái)能力可以構(gòu)建壁壘,市場(chǎng)需要算力強(qiáng)悍、模型全面的服務(wù)商。那些在算力、平臺(tái)、模型、應(yīng)用方面都有布局的大廠,對(duì)企業(yè)客戶具備更強(qiáng)吸引力。

百度、阿里、華為,除了自研大模型產(chǎn)品,還完成了從芯片到應(yīng)用的布局。百度是“昆侖芯+飛槳平臺(tái)+文心大模型”,阿里是“含光800芯片+M6-OFA底座+通義大模型”,華為是“昇騰芯片+MindSpore框架+盤(pán)古大模型”,這是其他公司在短期內(nèi)很難追上的優(yōu)勢(shì)。

季定宇認(rèn)為,在中國(guó)做通用大模型的公司,最終只能跑出一家,做個(gè)好的比早做出來(lái)更有價(jià)值?!拔易羁春米止?jié)跳動(dòng)和騰訊,一個(gè)是團(tuán)隊(duì)符合,一個(gè)是場(chǎng)景符合?!?/p>

劉迪更看好三家大廠——美團(tuán)、字節(jié)跳動(dòng)、華為。他對(duì)「定焦」分析:美團(tuán)是基于場(chǎng)景去找業(yè)務(wù),基于C端用戶高頻的交易數(shù)據(jù),能快速迭代模型;華為主打生態(tài)圈,在G端資源強(qiáng)大,具備極強(qiáng)的拿行業(yè)數(shù)據(jù)的能力;字節(jié)跳動(dòng)之前已經(jīng)將很多AI技術(shù)應(yīng)用到自家產(chǎn)品中,迭代能力極強(qiáng)。

不過(guò),這都是基于現(xiàn)階段的理論分析,行業(yè)格局具體會(huì)如何演變,還要看大廠們接下來(lái)如何出招接招。畢竟,大模型的賽道才剛剛鋪開(kāi)。

應(yīng)受訪者要求,季定宇為化名。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大廠混戰(zhàn)大模型:四大流派,各有所長(zhǎng)

一文讀懂大廠大模型。

文|定焦 溫故

編輯 | 方展博

今年以來(lái),整個(gè)科技圈最熱鬧的事情,是發(fā)布大模型。

從3月百度率先發(fā)布文心一言以來(lái),阿里、科大訊飛、360、騰訊紛紛跟上。7月,華為、京東、攜程也召開(kāi)發(fā)布會(huì),雖遲但到。

科技公司又卷起來(lái)了。以至于某頭部互聯(lián)網(wǎng)大廠的技術(shù)負(fù)責(zé)人,在一場(chǎng)發(fā)布會(huì)開(kāi)場(chǎng)就強(qiáng)調(diào):“今天不會(huì)發(fā)布預(yù)訓(xùn)練多模態(tài)大模型,今天也不會(huì)蹭大模型的熱點(diǎn)?!?/p>

7月17日下午,在攜程發(fā)布旅游行業(yè)垂直大模型后,除了極個(gè)別藏著掖著的互聯(lián)網(wǎng)大廠,大廠大模型基本集結(jié)完畢。

中國(guó)大廠大模型發(fā)布時(shí)間線 制圖 / 定焦

大模型越來(lái)越多,雖出自大廠,但真假難辨。大家的招數(shù)也不同,有的迷戀“作詩(shī)”,有的埋頭“做事”,還有的“講故事”。

根據(jù)資源能力、布局深度、出招套路,大廠的大模型可以分為不同的流派?!付ń埂箤⑺鼈兛偨Y(jié)為四大類型:

全能型:百度、阿里、騰訊、華為

業(yè)務(wù)型:京東、字節(jié)跳動(dòng)、科大訊飛

探索型:360、網(wǎng)易、攜程

觀望型:美團(tuán)、小米

業(yè)界普遍認(rèn)為,第一梯隊(duì)當(dāng)屬百度、阿里、騰訊、華為四家,它們的綜合實(shí)力最強(qiáng)。京東、字節(jié)跳動(dòng)、科大訊飛位列第二梯隊(duì),業(yè)務(wù)屬性較重;360、攜程、網(wǎng)易還在探索階段;美團(tuán)、小米還沒(méi)有發(fā)布大模型。

當(dāng)然,這個(gè)分類是動(dòng)態(tài)的。行業(yè)變化太快,大廠的進(jìn)展也是一日千里,格局隨時(shí)可能改寫(xiě)。

接下來(lái),「定焦」就帶大家探討一下,大廠的大模型都長(zhǎng)啥樣,哪家的大模型最強(qiáng),以及,大廠大模型,拼什么?

兩條路線,三個(gè)層級(jí)

在討論大廠大模型之前,我們先做一個(gè)背景科普。

首先,大模型不是新鮮事物。它不是突然蹦出來(lái)的,只是被ChatGPT帶火了。在去年11月底ChatGPT問(wèn)世之前,百度、阿里、騰訊、華為等大廠就有自己的大模型,而且經(jīng)常在一些國(guó)際測(cè)評(píng)類榜單中刷榜。

具體到大模型的類別,有兩條大的路線,一是通用,二是垂直。

所謂“通用”,可以簡(jiǎn)單理解為大模型啥都會(huì);“垂直”,是在某個(gè)特定領(lǐng)域做的特別好。這其中的差別,就像一個(gè)高中生畢業(yè)了,基本的能力素養(yǎng)都有,但沒(méi)啥專業(yè)性;另一個(gè)是職高畢業(yè),綜合能力差點(diǎn),但可能工地搬磚有一手,或修車修的好。

ChatGPT,以及百度文心一言、阿里通義千問(wèn),都是通用大模型,能聊天、寫(xiě)詩(shī)、作畫(huà),看起來(lái)比較全能。但你要讓它去做專業(yè)的在線問(wèn)診、物流規(guī)劃,可能做得很一般。

與之對(duì)應(yīng),像華為推出的礦山大模型、實(shí)時(shí)預(yù)測(cè)全球海浪的大模型,以及京東金融行業(yè)大模型,主打的就是“做事”和“專業(yè)”。

這兩條路線,是我們理解大模型的基礎(chǔ),也決定了大廠在布局大模型賽道時(shí)的戰(zhàn)略方向。

那么,不論是通用大模型還是垂直大模型,企業(yè)具體能做什么?

百度創(chuàng)始人兼CEO李彥宏曾給過(guò)創(chuàng)業(yè)公司一個(gè)建議:沒(méi)有必要再重新做基礎(chǔ)大模型,創(chuàng)業(yè)者的機(jī)會(huì)是在應(yīng)用層,將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機(jī)遇”。

先拋開(kāi)這個(gè)觀點(diǎn)的立場(chǎng),這里提到了“基礎(chǔ)大模型”和“應(yīng)用層”。這就涉及到大模型的三個(gè)層級(jí)。

中國(guó)大模型的創(chuàng)業(yè)生態(tài),玩家都在不同層級(jí)進(jìn)行站位——架構(gòu)層、模型層、應(yīng)用層。

架構(gòu)層的進(jìn)入門(mén)檻最高,功能有點(diǎn)類似基礎(chǔ)設(shè)施,能參與進(jìn)來(lái)的主要是各大云計(jì)算廠商,比如阿里、騰訊、百度、華為這四巨頭。

模型層的一大重點(diǎn)是基礎(chǔ)大模型,對(duì)算力、算法、數(shù)據(jù)、人才的要求非常高,一般的創(chuàng)業(yè)公司做不了。有一些公司選擇在基礎(chǔ)大模型之上做一些微調(diào),針對(duì)性推出行業(yè)大模型。

應(yīng)用層是基于前兩類大模型,調(diào)用API開(kāi)發(fā)應(yīng)用,就像手機(jī)行業(yè)基于安卓和iOS開(kāi)發(fā)APP,這是大部分創(chuàng)業(yè)公司能做的事情。大眾熟知的ChatGPT,其實(shí)是OpenAI對(duì)GPT-3模型微調(diào)后開(kāi)發(fā)出來(lái)的對(duì)話機(jī)器人應(yīng)用。

中國(guó)的科技公司在布局時(shí),尤其是BAT這樣的超級(jí)巨頭,往往會(huì)交叉覆蓋三大層級(jí)?;A(chǔ)打法是先發(fā)布通用大模型或者行業(yè)大模型底座,其他公司再基于這些基礎(chǔ)模型,結(jié)合自身?yè)碛械男袠I(yè)數(shù)據(jù),微調(diào)出自己的大模型應(yīng)用。

因?yàn)镃hatGPT的火爆,很多人將大模型理解為一個(gè)應(yīng)用或一款產(chǎn)品,是不太準(zhǔn)確的。大模型正在形成一個(gè)生態(tài),這其中有修高速公路的,有蓋房子的,還有搞精裝修的。

有野心的頭部大廠想拿下壁壘最高、賽道最寬闊的架構(gòu)層和模型層,但難度和風(fēng)險(xiǎn)系數(shù)極大,很可能投入之后看不到成果。中部大廠更多選擇在一些垂直行業(yè)深耕,先在具體場(chǎng)景落地,看到效果之后再加大投入。更多的大廠其實(shí)還在探索階段,一邊觀望一邊行進(jìn),摸著石頭過(guò)河。

大廠的招式與武功

隨著互聯(lián)網(wǎng)大廠陸續(xù)發(fā)布大模型,大廠們的布局逐漸清晰起來(lái)。

我們將百度、阿里、騰訊、華為歸入一梯隊(duì),一是因?yàn)樗麄冊(cè)诖竽P蜕掀鸩皆?,布局深,二是因?yàn)槟芰θ妗?/p>

百度是國(guó)內(nèi)第一個(gè)推出聊天機(jī)器人產(chǎn)品,開(kāi)放內(nèi)測(cè),硬剛ChatGPT的公司。

再把時(shí)間往前推四年,百度在2019年3月就對(duì)標(biāo)谷歌BERT模型,推出了文心大模型ERNIE 1.0,中文效果超越BERT。這個(gè)模型在2021年12月參數(shù)達(dá)千億,跨入“智能涌現(xiàn)”門(mén)檻。ERNIE 3.0 Zeus也是國(guó)內(nèi)首個(gè)開(kāi)放API調(diào)用的千億大模型。

阿里在今年4月11日發(fā)布對(duì)標(biāo)ChatGPT的大語(yǔ)言模型通義千問(wèn),快速接入釘釘、天貓精靈,然后在3個(gè)月內(nèi)推出了聚焦音頻的大模型應(yīng)用通義聽(tīng)悟,以及AI繪畫(huà)大模型通義萬(wàn)相,通義大模型家族日漸成型。

如此快節(jié)奏,是因?yàn)榘⒗锇褱?zhǔn)備工作做到位了。阿里很早就發(fā)布了語(yǔ)言大模型Plug和多模態(tài)大模型M6,M6在2021年10月參數(shù)規(guī)模達(dá)10萬(wàn)億,是當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。這兩個(gè)模型在去年9月合并,發(fā)展為今天的通義大模型。

騰訊直到今年6月下旬才召開(kāi)發(fā)布會(huì),是大廠中相對(duì)較晚的一個(gè),而且它沒(méi)有像百度、阿里一樣發(fā)布通用大模型,而是面向B端客戶發(fā)布了行業(yè)大模型解決方案。華為也是一樣,它在7月7日發(fā)布面向行業(yè)的盤(pán)古大模型3.0,沒(méi)有發(fā)布聊天機(jī)器人。

騰訊和華為的硬實(shí)力都很強(qiáng)。騰訊在去年4月發(fā)布了混元大模型,這是一個(gè)集計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理于一體的多模態(tài)大模型,已經(jīng)在騰訊各大業(yè)務(wù)模塊中應(yīng)用。華為的盤(pán)古大模型早在2021年4月就發(fā)布了,還落地了一些具體的場(chǎng)景。

這波AI2.0浪潮,很多能力都是建立在云平臺(tái)之上。不論是算力、模型,還是工具鏈,都是通過(guò)云平臺(tái)對(duì)外輸出。在此基礎(chǔ)上,大公司建設(shè)大模型生態(tài),支撐更多應(yīng)用生長(zhǎng),是一套比較高級(jí)的打法,目前能玩轉(zhuǎn)的也就這四家大廠。

二梯隊(duì)的京東、字節(jié)跳動(dòng)、科大訊飛,我們將之歸入“業(yè)務(wù)型”選手,因?yàn)樗麄兊哪芰?cè)重模型層,更看中跟業(yè)務(wù)結(jié)合。

比如京東,7月13日京東推出AI大模型“言犀”,這是一個(gè)面向產(chǎn)業(yè)的垂直大模型,側(cè)重解決真實(shí)場(chǎng)景的實(shí)際問(wèn)題。過(guò)去這些年京東除了在電商賣貨,物流、金融、健康等業(yè)務(wù)也發(fā)展起來(lái)了,所以“言犀”大模型一開(kāi)始主要面向零售、金融、城市、健康和物流領(lǐng)域。早期自用為主,后期向外部客戶開(kāi)放。

再比如科大訊飛?!靶腔鹫J(rèn)知大模型”在5月6日發(fā)布,同時(shí)發(fā)布的還有其在教育、辦公、汽車、數(shù)字員工方向的落地應(yīng)用,還將接入學(xué)習(xí)機(jī)、錄音轉(zhuǎn)寫(xiě)工具“訊飛聽(tīng)見(jiàn)”等產(chǎn)品。

字節(jié)跳動(dòng)的玩法比較特別,它在6月28日發(fā)布了“火山方舟”。注意,這不是大模型,官方說(shuō)法是“企業(yè)級(jí)大模型服務(wù)平臺(tái)”。簡(jiǎn)言之就是一個(gè)大模型超市,字節(jié)不生產(chǎn)大模型,只“搬運(yùn)”大模型。

這三家大廠,在做業(yè)務(wù)方面都很有一手。對(duì)他們而言,大模型更多是一個(gè)工具,先在自己內(nèi)部跑通,把效率提上來(lái),看到實(shí)實(shí)在在的效果后,再考慮加大投入推廣。

三梯隊(duì)的360、網(wǎng)易、攜程,大模型還在探索階段。

這其中360可能不服氣,自從ChatGPT火了之后,低調(diào)了很久的“紅衣教主”周鴻祎突然又活躍起來(lái),頻頻發(fā)表言論。已經(jīng)包裝成“數(shù)字安全公司”的360,在6月13日發(fā)布“360智腦大模型”和一款數(shù)字人產(chǎn)品。

不過(guò),雖然產(chǎn)品功能豐富,但外界對(duì)360大模型的技術(shù)水平存疑。360自稱前期在AIGC技術(shù)一直有投入,去年還發(fā)起了計(jì)劃投資總額2.23億元的項(xiàng)目,半年過(guò)去了,募來(lái)的錢只投了5%。

攜程和網(wǎng)易在大模型上的布局,目前還不是很系統(tǒng)。網(wǎng)易聲稱從2021年開(kāi)始打造“玉知”多模態(tài)理解大模型,借助了華為昇騰AI的力量,在行業(yè)里存在感不強(qiáng)。攜程發(fā)布旅游行業(yè)垂直大模型“攜程問(wèn)道”,出發(fā)點(diǎn)是提升內(nèi)部各大業(yè)務(wù)的工作效率。

美團(tuán)和小米沒(méi)有發(fā)布大模型,但內(nèi)部已經(jīng)啟動(dòng)相關(guān)項(xiàng)目。美團(tuán)最新的動(dòng)態(tài)是接盤(pán)王慧文的光年之外,這對(duì)美團(tuán)的大模型業(yè)務(wù)實(shí)際有多大幫助,尚待觀察。

大廠大模型,拼什么?

這么多大模型,怎么評(píng)估好壞?

上半年的“百模大戰(zhàn)”中,中國(guó)大廠們?cè)谕瞥鲎约掖竽P蜁r(shí),都喜歡拿參數(shù)量說(shuō)事。ChatGPT已經(jīng)證明了大模型存在“涌現(xiàn)”現(xiàn)象,大模型的參數(shù)量越大,智能程度越高。

這是一個(gè)非常粗暴的指標(biāo)。阿里、百度等大廠幾年前就推出過(guò)萬(wàn)億參數(shù)的大模型,但參數(shù)大和能力強(qiáng)是兩回事。

另外一個(gè)常用的評(píng)價(jià)維度是公開(kāi)的評(píng)測(cè)集和榜單打分,中國(guó)的大廠非常喜歡參與。

比如騰訊,騰訊的混元大模型去年發(fā)布后,參加了很多榜單排名,在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模態(tài)視頻檢索數(shù)據(jù)集榜單中,先后取得第一名的成績(jī),實(shí)現(xiàn)了跨模態(tài)檢索領(lǐng)域的大滿貫,分?jǐn)?shù)更是打破多項(xiàng)紀(jì)錄。

百度的文心大模型,過(guò)去幾年也經(jīng)常登頂全球權(quán)威的GLUE榜單,甚至超過(guò)微軟、谷歌、OpenAI等公司。最近IDC發(fā)布了大模型評(píng)估報(bào)告,百度文心大模型在7項(xiàng)核心指標(biāo)上拿下滿分,綜合評(píng)分第一。

這個(gè)方式的局限性在于,會(huì)導(dǎo)致出現(xiàn)一些“應(yīng)試型選手”,測(cè)評(píng)分?jǐn)?shù)跟實(shí)際表現(xiàn)相差較遠(yuǎn)。

國(guó)內(nèi)一家AI創(chuàng)業(yè)公司的創(chuàng)始人季定宇對(duì)「定焦」說(shuō),“大模型是綜合能力的體現(xiàn),所有的測(cè)評(píng)都不能體現(xiàn)全部”,“在刷榜這件事上,大廠們就沒(méi)有輸過(guò)”。

當(dāng)一個(gè)新的風(fēng)口出現(xiàn)時(shí),創(chuàng)業(yè)者和資本一擁而上,導(dǎo)致信息差普遍存在。尤其是在早期階段,外界缺乏足夠的辨別力,這個(gè)時(shí)候誰(shuí)的聲量大,誰(shuí)就能獲得更高的關(guān)注度。

華為的盤(pán)古大模型推出兩年來(lái),普通人知之甚少。ChatGPT火了之后,盤(pán)古大模型迅速升級(jí)到3.0版本,并再次重磅向外界發(fā)布。

盛景嘉成董事總經(jīng)理劉迪對(duì)「定焦」說(shuō):“對(duì)于大廠而言,當(dāng)大家都在發(fā)布大模型時(shí),你是不能缺席的。因?yàn)镚PT的影響,大廠很被動(dòng)地將原來(lái)可能計(jì)劃在2-3年做的事情,壓縮到三個(gè)月快速地做出來(lái)?!?/p>

這就像一場(chǎng)賽跑,大家都在搶跑,顧不上姿勢(shì)和動(dòng)作是否優(yōu)雅。

對(duì)一些大廠而言,把什么產(chǎn)品、哪塊能力拿出來(lái)發(fā)布,是一道選擇題。大廠也要迎合熱點(diǎn)、造勢(shì)、包裝。開(kāi)發(fā)布會(huì)更多是一個(gè)宣傳行為,真正的功夫是在臺(tái)下,在幕后。

為了突出自身優(yōu)勢(shì),很多大廠會(huì)對(duì)標(biāo)GPT,用“在指標(biāo)前加定語(yǔ)”的方式來(lái)作對(duì)比,尤其是“中文能力”這項(xiàng)指標(biāo)。但目前,從C端用戶反饋來(lái)看,用戶量最大、體驗(yàn)最好的,依然是ChatGPT。

劉迪認(rèn)為,從商業(yè)模式上,大廠很難將大模型包裝成類似微信這種,大范圍使用的付費(fèi)C端產(chǎn)品,因?yàn)樗懔μ∪?。“現(xiàn)在的算力用來(lái)做微調(diào)和日常的B端業(yè)務(wù)處理都已經(jīng)很緊,C端的量一旦上來(lái),大廠支撐不住。

這導(dǎo)致的結(jié)果是,賣算力資源的云廠商,搶先一步吃到了大模型的紅利。

提前囤了超過(guò)1萬(wàn)張英偉達(dá)GPU的字節(jié)跳動(dòng),直到現(xiàn)在也沒(méi)有推出自己的大模型。在大廠發(fā)布大模型最熱鬧的4月,它旗下的算力平臺(tái)火山引擎,推出了自研DPU等系列云產(chǎn)品(DPU是一種定制化的加速硬件),支持萬(wàn)卡級(jí)大模型訓(xùn)練。

字節(jié)跳動(dòng)選擇為其他大模型公司提供算力服務(wù),雙方的關(guān)系就像微軟和OpenAI、亞馬遜和Bedrock?;鹕揭婵偛米T待稱,國(guó)內(nèi)大模型領(lǐng)域的數(shù)十家企業(yè),超過(guò)七成已經(jīng)在火山引擎云上。

綜合來(lái)看,大模型賽道還處在早期階段,大廠們雖然發(fā)布了產(chǎn)品,但搶跑的意味很濃。因?yàn)橘惖缐蜷L(zhǎng),一時(shí)的搶跑無(wú)法形成長(zhǎng)期優(yōu)勢(shì)。而且,行業(yè)變化迭代太快,技術(shù)、產(chǎn)品都可能隨時(shí)重新洗牌。

短暫的聲量之爭(zhēng)過(guò)后,才會(huì)進(jìn)入比拼硬實(shí)力的階段。

誰(shuí)最有可能勝出?

從年初至今,大家對(duì)大模型的認(rèn)識(shí)在逐漸發(fā)生變化。

年初,行業(yè)里的共識(shí)是,通用大模型是未來(lái)。大家覺(jué)得,通用大模型在各個(gè)場(chǎng)景都有很好表現(xiàn),可以解決一切問(wèn)題。大廠中,已經(jīng)發(fā)布類ChatGPT產(chǎn)品的有百度、阿里、科大訊飛、360。

后來(lái),大家發(fā)現(xiàn)這些產(chǎn)品更像是玩具。它們擅長(zhǎng)坐而論道,你跟它們聊天沒(méi)問(wèn)題,但要讓它們干具體的活,可能不太靠譜。

大廠迅速捕捉到了市場(chǎng)的變化。百度就發(fā)現(xiàn),文心一言發(fā)布后,一開(kāi)始來(lái)交流的企業(yè)都是CEO級(jí)別的人出面,后來(lái)大多是技術(shù)負(fù)責(zé)人或業(yè)務(wù)負(fù)責(zé)人。字節(jié)跳動(dòng)發(fā)現(xiàn),來(lái)找火山引擎的企業(yè),四五月份都是模型廠商,需求是訓(xùn)練模型,現(xiàn)在是一些行業(yè)客戶,希望在營(yíng)銷、客服等場(chǎng)景落地。

于是下半年,風(fēng)向變了。行業(yè)迅速達(dá)成新的共識(shí):行業(yè)大模型更靠譜,要從通用面向產(chǎn)業(yè)。大廠對(duì)外講故事的口徑也隨之變化,紛紛開(kāi)始發(fā)布行業(yè)大模型。

騰訊在6月下旬推出行業(yè)“精選模型商店”時(shí),騰訊云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生說(shuō),“聊天機(jī)器人不是唯一的大模型服務(wù)方式,也不一定是滿足行業(yè)需求的最優(yōu)解?!?/p>

華為7月上旬發(fā)布的盤(pán)古大模型3.0是面向行業(yè),華為常務(wù)董事、華為云CEO張平安稱,華為的盤(pán)古大模型不寫(xiě)詩(shī),要扎根于行業(yè),為各個(gè)行業(yè)帶來(lái)價(jià)值。

京東的“言犀”大模型定位直接就是面向產(chǎn)業(yè)。京東云事業(yè)部總裁曹鵬說(shuō),對(duì)話類的通用大模型不應(yīng)該是大模型的全部,大模型不應(yīng)該只是拿來(lái)聊天寫(xiě)詩(shī)作畫(huà)的玩具。

在diss通用大模型的同時(shí),這三家大廠開(kāi)始在“產(chǎn)業(yè)”上大做文章,凸顯自己的優(yōu)勢(shì)。他們的產(chǎn)品,均主要面向To B行業(yè)市場(chǎng)。

劉迪認(rèn)為,對(duì)于大廠而言,大模型有兩個(gè)價(jià)值,一是內(nèi)部做節(jié)流,把優(yōu)化的效率轉(zhuǎn)化成利潤(rùn);二是對(duì)外拓客,讓其他客戶賺到錢,大廠從中拿走合理的利潤(rùn)。最終一定要商業(yè)化。“拋開(kāi)技術(shù)指標(biāo),評(píng)價(jià)一個(gè)模型好不好用,就看用的人多不多。一看收費(fèi)客戶數(shù)量,二看創(chuàng)造的收入金額。”

MaaS模式(Models as a Service,模型即服務(wù))開(kāi)始被更多大廠搬到臺(tái)面上。去年的云棲大會(huì),以及今年的百度文心一言發(fā)布會(huì),都提到了這一概念。騰訊則公布了MaaS能力全景圖。

就像當(dāng)年的云計(jì)算市場(chǎng)一樣,底層算力和平臺(tái)能力可以構(gòu)建壁壘,市場(chǎng)需要算力強(qiáng)悍、模型全面的服務(wù)商。那些在算力、平臺(tái)、模型、應(yīng)用方面都有布局的大廠,對(duì)企業(yè)客戶具備更強(qiáng)吸引力。

百度、阿里、華為,除了自研大模型產(chǎn)品,還完成了從芯片到應(yīng)用的布局。百度是“昆侖芯+飛槳平臺(tái)+文心大模型”,阿里是“含光800芯片+M6-OFA底座+通義大模型”,華為是“昇騰芯片+MindSpore框架+盤(pán)古大模型”,這是其他公司在短期內(nèi)很難追上的優(yōu)勢(shì)。

季定宇認(rèn)為,在中國(guó)做通用大模型的公司,最終只能跑出一家,做個(gè)好的比早做出來(lái)更有價(jià)值?!拔易羁春米止?jié)跳動(dòng)和騰訊,一個(gè)是團(tuán)隊(duì)符合,一個(gè)是場(chǎng)景符合?!?/p>

劉迪更看好三家大廠——美團(tuán)、字節(jié)跳動(dòng)、華為。他對(duì)「定焦」分析:美團(tuán)是基于場(chǎng)景去找業(yè)務(wù),基于C端用戶高頻的交易數(shù)據(jù),能快速迭代模型;華為主打生態(tài)圈,在G端資源強(qiáng)大,具備極強(qiáng)的拿行業(yè)數(shù)據(jù)的能力;字節(jié)跳動(dòng)之前已經(jīng)將很多AI技術(shù)應(yīng)用到自家產(chǎn)品中,迭代能力極強(qiáng)。

不過(guò),這都是基于現(xiàn)階段的理論分析,行業(yè)格局具體會(huì)如何演變,還要看大廠們接下來(lái)如何出招接招。畢竟,大模型的賽道才剛剛鋪開(kāi)。

應(yīng)受訪者要求,季定宇為化名。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。