文|AI鯨選社 陳佳惠
編輯|楊曉鶴
“釘釘也有OpenAI的API接口,但是我們主要的合作伙伴是國(guó)內(nèi)的大模型五小虎?!?/p>
在釘釘最新的AI改版采訪會(huì)上,釘釘總裁不窮說(shuō)道,大家可以在釘釘上調(diào)用通義或者Kimi等很多大模型。這也意味著,五小虎在釘釘這個(gè)日活數(shù)億的平臺(tái),不用面對(duì)最強(qiáng)大的對(duì)手。也不僅是在辦公平臺(tái)中,在國(guó)內(nèi)諸多AI業(yè)務(wù)場(chǎng)景中,國(guó)產(chǎn)大模型都不用面對(duì)ChatGPT了。
這無(wú)疑對(duì)很多國(guó)產(chǎn)大模型是一個(gè)利好的消息。盡管微軟云還能提供API支持,但如今Azure也在有意減少在華業(yè)務(wù),因此帶來(lái)的競(jìng)爭(zhēng)壓力幾乎沒(méi)有。
更關(guān)鍵的是,ChatGPT的更新速度也明顯放緩,盡管OpenAI創(chuàng)始人Sam Altman在演講中表示:“Scaling laws依舊有效,GPT-5將比GPT-4聰明得多,我們還沒(méi)有到達(dá)這條曲線的頂端”。但GPT-5將會(huì)何時(shí)發(fā)布,還是個(gè)未知數(shù)。
這也意味著,過(guò)去一年半時(shí)間,國(guó)產(chǎn)大模型一直能狂追,ChatGPT-4o珠玉在前,國(guó)產(chǎn)大模型已經(jīng)追趕到哪里了?
2024年主流大模型能力測(cè)評(píng)圖
差距縮短到半年,集體進(jìn)化到Turbo水平
2023年大模型領(lǐng)域,爭(zhēng)吵的最大話題,是國(guó)產(chǎn)大模型到底距離OpenAI,還有多遠(yuǎn)的差距。百度創(chuàng)始人李彥宏說(shuō)只差兩個(gè)月,王小川說(shuō)怎么可能,如今這一答案基本明了。
ChatGPT-4 Turbo是在2023年11月7日的OpenAI開(kāi)發(fā)者大會(huì)上發(fā)布,讓當(dāng)時(shí)的大模型界振聾發(fā)聵。但距離GPT上次更新已遙遙8個(gè)月,國(guó)產(chǎn)大模型在這期間分秒必爭(zhēng),如今基本宣布自己已經(jīng)達(dá)到或超過(guò)ChatGPT-4 Turbo,也即意味著差距至少在半年之久。
但也有個(gè)別領(lǐng)域差異化領(lǐng)先,全球著名開(kāi)源平臺(tái)huggingface(笑臉)的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clem在社交平臺(tái)宣布,阿里最新開(kāi)源的Qwen2-72B指令微調(diào)版本,成為開(kāi)源模型排行榜第一名。
這一成績(jī)振奮人心。不僅如此,根據(jù)排行榜的數(shù)據(jù)顯示,Meta開(kāi)源的Llama-3-70B指令微調(diào)版本位列第2;阿里的Qwen2-72B基礎(chǔ)版本排名第3;第9和第10名,全部都是阿里之前開(kāi)源的Qwen1.5基礎(chǔ)和Chat版本。
阿里的開(kāi)源大模型不僅在前十名中占據(jù)了4個(gè)坑位,還超越了科技巨頭Meta的Llama-3-70B。Llama號(hào)稱是眾多國(guó)產(chǎn)大模型之母,不少國(guó)產(chǎn)大模型都辟謠過(guò)關(guān)系,這次終于實(shí)現(xiàn)了超越。不僅阿里通義,智譜AI也是開(kāi)源路上一員猛將。智譜開(kāi)源了其第四代的GLM模型—GLM-4-9B。
GLM-4-9B開(kāi)源模型綜合能力相比 ChatGLM3-6B 提升 40% ,中文學(xué)科能力提升 50%,最高支持達(dá) 1 百萬(wàn) tokens 長(zhǎng)文本,支持 26 種語(yǔ)言。閉源大模型的競(jìng)爭(zhēng)更加激烈,各家最新版本紛紛稱超越ChatGPT-4 Turbo。6月21日,不走AGI、更強(qiáng)調(diào)行業(yè)落地路線的華為盤(pán)古大模型 5.0正式發(fā)布。盤(pán)古大模型 5.0 聲稱能夠更好地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。已在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中落地。
接下來(lái)的6月27日,科大訊飛在北京發(fā)布訊飛星火大模型V4.0。并且,訊飛星火V4.0是基于全國(guó)首個(gè)國(guó)產(chǎn)萬(wàn)卡算力集群“飛星一號(hào)”訓(xùn)練而成。科大訊飛董事長(zhǎng)劉慶峰稱,訊飛星火參與國(guó)內(nèi)外中英文12項(xiàng)大模型主流測(cè)試集,其中8個(gè)測(cè)試集中排名第一,超越GPT-4 Turbo等國(guó)際大模型。其在文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力等方面也實(shí)現(xiàn)對(duì)GPT-4 Turbo的超越。
雖然星火大模型在各種整體評(píng)分中,很多時(shí)候不在國(guó)產(chǎn)大模型前三甲,但有項(xiàng)能力國(guó)際領(lǐng)先,這次發(fā)布的星火語(yǔ)音大模型,據(jù)悉在數(shù)十個(gè)主流語(yǔ)種的語(yǔ)音識(shí)別效果層面,超過(guò)OpenAI Whisper V3,而多語(yǔ)種語(yǔ)音合成方面,星火語(yǔ)音大模型擬人度則已超83%。
大模型迭代熱還在繼續(xù),緊接著的6月28日,百度在Wave Summit上直接發(fā)布了大幅強(qiáng)化檢索能力的文心大模型——文心大模型4.0 Turbo。文心大模型4.0 Turbo,可以通過(guò)文心一言的網(wǎng)頁(yè)端和APP端使用,同時(shí)面向開(kāi)發(fā)者提供了API支持。
文心4.0 Turbo模型強(qiáng)化了檢索能力,全網(wǎng)搜索、分析資料、等待回復(fù)這些步驟的融合,不僅提高了回答的速度,也在一定程度上緩解了大模型回答中“幻覺(jué)”的問(wèn)題。
同時(shí),百度飛槳發(fā)布新一代飛槳框架3.0 Beta版本,具備大模型訓(xùn)推一體、動(dòng)靜統(tǒng)一自動(dòng)并行、編譯器自動(dòng)優(yōu)化以及大模型多硬件適配等特色。訓(xùn)推一體的統(tǒng)一有利于推理優(yōu)化,也能降低大模型的開(kāi)發(fā)成本,可以幫助大模型實(shí)現(xiàn)更快迭代。多模態(tài)領(lǐng)域,騰訊混元大模型的Di-T架構(gòu)和階躍星辰的1T-MoE多模態(tài)的感知能力,算是領(lǐng)域驚喜。
騰訊混元大模型號(hào)稱全球最早的Di-T架構(gòu),雖然大模型發(fā)布的晚,但好在架構(gòu)先進(jìn)。當(dāng)然也得感謝Sora,這個(gè)期貨產(chǎn)品,讓市場(chǎng)形成Di-T架構(gòu)是多模態(tài)大模型未來(lái)的共識(shí)。
階躍星辰在7月的WAIC上發(fā)布萬(wàn)億級(jí)參數(shù)MoE(混合專家)大語(yǔ)言模型Step-2正式版,Step-1.5V多模態(tài)大模型,以及Step-1X 圖像生成大模型。對(duì)多模態(tài)大模型的Step-2理解在行業(yè)領(lǐng)先,未來(lái)表現(xiàn)值得期待。
沉睡的CV巨頭商湯也開(kāi)始發(fā)力,WAIC上發(fā)布流式原生多模態(tài)交互模型——6000億參數(shù)日日新5.5系列大模型,其中5o版本有類似ChatGPT-4o類似的交互能力。
國(guó)產(chǎn)大模型們逐漸走出了“不斷追趕GPT-4”的敘事線。從技術(shù)角度看,國(guó)產(chǎn)大模型和ChatGPT-4o的差距一直在縮小,多模態(tài)領(lǐng)域甚至有了并肩前行的感覺(jué)。
AI應(yīng)用還未爆發(fā),各家爭(zhēng)NO.1 的口徑
“沒(méi)有應(yīng)用,開(kāi)源閉源模型都一文不值?!崩顝┖曜罱l頻闡述自己的AI理念,“要跳出移動(dòng)時(shí)代的思維邏輯,避免掉入“超級(jí)應(yīng)用陷阱”,不是只有10億DAU的應(yīng)用才叫成功。”話雖說(shuō)如此,但這場(chǎng)AI應(yīng)用的暗戰(zhàn),沒(méi)有人會(huì)放松。
據(jù)量子位分析智庫(kù)顯示,豆包AI的6月份的APP端下載量位居榜首,達(dá)到了5000萬(wàn)。文心一言的下載總量達(dá)到1400萬(wàn),暫時(shí)位列第三。但百度公布的另一維度數(shù)據(jù)是第一:文心一言用戶規(guī)模達(dá)到3億,日調(diào)用量超過(guò)了5億。這是百度Wave Summit 2024大會(huì)上公布的數(shù)字。文心一言曾在去年12月公開(kāi)用戶規(guī)模首次破億;兩三個(gè)月前日均調(diào)用量也在2億。
時(shí)隔六個(gè)月,文心一言的用戶數(shù)量已翻了三倍,增長(zhǎng)迅猛。現(xiàn)如今,文心一言達(dá)成“每5個(gè)人中就有1個(gè)人用過(guò)”的成績(jī),百度在發(fā)展大模型的路徑上,除了全面AI化百度系應(yīng)用,諸如百度文庫(kù)經(jīng)過(guò)AI大模型改造后,目前付費(fèi)用戶也已有2600萬(wàn)。最重要的發(fā)展方向是智能體。
在WAIC上,李彥宏坦言,智能體是百度最看好的AI發(fā)展方向。智能體也是當(dāng)下AI走進(jìn)C端的最佳形象。李彥宏表示,制作智能體的門(mén)檻并不高:只需要對(duì)著大模型把工作流程講清楚,就可以生成一個(gè)有價(jià)值的智能體。
數(shù)據(jù)顯示,文心大模型星河共創(chuàng)計(jì)劃啟動(dòng)一年以來(lái),文心大模型也已經(jīng)和眾多合作伙伴、開(kāi)發(fā)者一起,共創(chuàng)了55萬(wàn)個(gè)AI應(yīng)用。
盡管很多AI應(yīng)用不到千個(gè)使用次數(shù),但智能體確實(shí)能實(shí)現(xiàn)多步復(fù)雜流程的AI調(diào)用。大模型產(chǎn)品化中獨(dú)樹(shù)一派的選手要屬月之暗面的Kimi和豆包App,這是少數(shù)專注To C的選手,旗下產(chǎn)品Kimi AI非常適合案頭等工作場(chǎng)景中應(yīng)用,支持200萬(wàn)漢字的長(zhǎng)文本輸入,主打無(wú)損記憶以及“長(zhǎng)文本”,被網(wǎng)友稱為ChatGPT中文平替。
據(jù)量子位分析智庫(kù)數(shù)據(jù),2024年6月,Kimi智能助手月訪問(wèn)總量達(dá)2200萬(wàn)。Kimi智能助手APP月新增下載量超300萬(wàn),較5月增長(zhǎng)速度提升50%。為了讓大家更方便體驗(yàn)AI。7月8日,Kimi上線了瀏覽器插件,在大模型輕量應(yīng)用上做出探索。
Kimi瀏覽器插件目前有“點(diǎn)問(wèn)筆”和“總結(jié)器”兩項(xiàng)功能。和月之暗面不謀而合的是,字節(jié)跳動(dòng)旗下AI助手豆包此前也推出了瀏覽器插件版本。劃線問(wèn)和AI總結(jié)網(wǎng)頁(yè),這是用戶在瀏覽網(wǎng)頁(yè)時(shí)的痛點(diǎn)需求,Monica就憑借類似的瀏覽器插件能力,獲得了幾百萬(wàn)用戶。kimi和豆包瀏覽器插件,預(yù)計(jì)也能占據(jù)很大的市場(chǎng)。
To C賽道上,6月份最重磅的玩家,要屬騰訊旗下大模型應(yīng)用“騰訊元寶”。作為多模態(tài)大模型底座上亮相的AI對(duì)話應(yīng)用,還上線了深度搜索模式。在深度搜索模式下,元寶從深度和廣度兩方面對(duì)搜索內(nèi)容進(jìn)行拓展,并可同步至大綱、思維導(dǎo)圖、相關(guān)人物事件梳理等,幫助用戶掌握搜索內(nèi)容。科大訊飛董事長(zhǎng)劉慶峰表示,自去年9月全面開(kāi)放以來(lái),訊飛星火APP在安卓公開(kāi)市場(chǎng)累計(jì)下載量達(dá)1.31億次,在國(guó)內(nèi)工具類通用大模型App中排名第一。
這個(gè)口徑的第一,也讓訊飛星火大模型有底氣做發(fā)展路線的第三派,積極將大模型整合進(jìn)硬件等產(chǎn)品中。一方面將大模型能力落地學(xué)習(xí)機(jī)、翻譯機(jī)、辦公本等自有智能硬件;另一方面,將大模型的能力深度賦能行業(yè),正在落地汽車(chē)、家電、機(jī)器人、AI手機(jī)、AI PC等領(lǐng)域。
數(shù)據(jù)顯示,科大訊飛AI學(xué)習(xí)機(jī)獲得了2023年天貓&京東雙十一銷(xiāo)售額冠軍。其新推出的智能批閱機(jī)可以一分鐘掃描90份學(xué)生作業(yè),平時(shí)教師一個(gè)半小時(shí)批改的工作任務(wù)批閱機(jī)5分鐘就可以完成。走進(jìn)教育、醫(yī)療場(chǎng)景中的科大訊飛,已經(jīng)找到了自己的營(yíng)收?qǐng)鼍啊?/p>
大模型5小虎難存活?商業(yè)化艱難的一步
6月份,梅花創(chuàng)投吳世春提到,“中國(guó)大模型五虎”想要跑出來(lái)非常難。"這句暴論在大模型圈引起了不少爭(zhēng)論。的確,從統(tǒng)計(jì)到的數(shù)據(jù)看,目前大模型整體的商業(yè)化還比較基礎(chǔ)。據(jù)『智能超參數(shù)』公開(kāi)渠道統(tǒng)計(jì)到的數(shù)據(jù),6月份大模型相關(guān)中標(biāo)項(xiàng)目75個(gè),其中:有30個(gè)項(xiàng)目,未披露中標(biāo)金額(為方便統(tǒng)計(jì),金額以0計(jì)算),其余45個(gè)中標(biāo)項(xiàng)目披露的金額達(dá)到了1.38億元。
大模型中標(biāo)情況,來(lái)源:智能超參數(shù)
科大訊飛單月里中標(biāo)的項(xiàng)目是8個(gè),披露的中標(biāo)金額為3895萬(wàn)元,百度單月中標(biāo)項(xiàng)目7個(gè),披露的中標(biāo)金額2831萬(wàn)元。此外,商湯科技、阿里云、騰訊云、智譜AI等廠商也都有中標(biāo)項(xiàng)目。在AI產(chǎn)業(yè)的浪潮中,雖然表面上看似繁榮,但商業(yè)化的挑戰(zhàn)和艱難卻是不容忽視的現(xiàn)實(shí)。
以科大訊飛和百度為例,這兩家公司在單月內(nèi)中標(biāo)的數(shù)量和金額相對(duì)光鮮,但與巨大的研發(fā)投入相比,卻顯得有些杯水車(chē)薪。百度2023財(cái)報(bào)顯示,百度投入研發(fā)費(fèi)用為242億元,同比增加4%;2023年科大訊飛的研發(fā)費(fèi)用為34.81億元,同比增長(zhǎng)11.89%,投向星火大模型的費(fèi)用規(guī)模便超20億。
且根據(jù)華為高管公布的信息,開(kāi)發(fā)和一次訓(xùn)練AI大模型的成本就高達(dá)1200萬(wàn)美元。從中標(biāo)項(xiàng)目中看,大模型本身商業(yè)化還比較少。2024年6月份的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,應(yīng)用類和算力類的項(xiàng)目占據(jù)了絕對(duì)的主導(dǎo)地位,這兩類的占比自2023年以來(lái)一直在90%以上,且應(yīng)用類的占比還在逐漸增大。
大模型中標(biāo)類別,來(lái)源:智能超參數(shù)
因此,盡管場(chǎng)面熱鬧,大模型應(yīng)用的落地卻大多還處于嘗鮮、試點(diǎn)階段,同質(zhì)化現(xiàn)象嚴(yán)重,缺乏清晰的商業(yè)路徑。更壞的消息是,盡管如此,國(guó)內(nèi)大模型廠商們悄無(wú)聲息地拉開(kāi)了”價(jià)格戰(zhàn)“的序幕。5月,字節(jié)跳動(dòng)把Token的定價(jià)降低了一個(gè)數(shù)量級(jí),從以分計(jì)價(jià)進(jìn)入以厘計(jì)價(jià)時(shí)代。
業(yè)內(nèi)戲言,大模型價(jià)格進(jìn)入了“厘時(shí)代”。根據(jù)火山引擎公布的價(jià)格計(jì)算,1元就能買(mǎi)到豆包主力模型的125萬(wàn)Tokens,大約是200萬(wàn)個(gè)漢字。200萬(wàn)字是什么概念,大概相當(dāng)于10本書(shū)。阿里通義、百度文心、智譜等相繼開(kāi)始跟進(jìn)價(jià)格戰(zhàn)。
同樣的趨勢(shì)也發(fā)生在國(guó)外。自去年以來(lái),OpenAI已經(jīng)進(jìn)行了4次降價(jià),在OpenAI發(fā)布了最新發(fā)布的多模態(tài)大模型GPT-4o中,不僅大模型性能有了很大提升,價(jià)格也下調(diào)了50%。大模型廠商們?cè)噲D通過(guò)降低成本來(lái)推動(dòng)大模型的普及和應(yīng)用。
然而,這種策略雖然能夠吸引用戶嘗試,但能否轉(zhuǎn)化為持續(xù)的商業(yè)化成功,還有待市場(chǎng)的檢驗(yàn)。AI大模型產(chǎn)業(yè)找到可行的商業(yè)模式,實(shí)現(xiàn)可持續(xù)的盈利,是所有AI企業(yè)需要面對(duì)的問(wèn)題。