文|AI鯨選社 陳佳惠
編輯|楊曉鶴
“釘釘也有OpenAI的API接口,但是我們主要的合作伙伴是國內(nèi)的大模型五小虎。”
在釘釘最新的AI改版采訪會上,釘釘總裁不窮說道,大家可以在釘釘上調(diào)用通義或者Kimi等很多大模型。這也意味著,五小虎在釘釘這個(gè)日活數(shù)億的平臺,不用面對最強(qiáng)大的對手。也不僅是在辦公平臺中,在國內(nèi)諸多AI業(yè)務(wù)場景中,國產(chǎn)大模型都不用面對ChatGPT了。
這無疑對很多國產(chǎn)大模型是一個(gè)利好的消息。盡管微軟云還能提供API支持,但如今Azure也在有意減少在華業(yè)務(wù),因此帶來的競爭壓力幾乎沒有。
更關(guān)鍵的是,ChatGPT的更新速度也明顯放緩,盡管OpenAI創(chuàng)始人Sam Altman在演講中表示:“Scaling laws依舊有效,GPT-5將比GPT-4聰明得多,我們還沒有到達(dá)這條曲線的頂端”。但GPT-5將會何時(shí)發(fā)布,還是個(gè)未知數(shù)。
這也意味著,過去一年半時(shí)間,國產(chǎn)大模型一直能狂追,ChatGPT-4o珠玉在前,國產(chǎn)大模型已經(jīng)追趕到哪里了?
2024年主流大模型能力測評圖
差距縮短到半年,集體進(jìn)化到Turbo水平
2023年大模型領(lǐng)域,爭吵的最大話題,是國產(chǎn)大模型到底距離OpenAI,還有多遠(yuǎn)的差距。百度創(chuàng)始人李彥宏說只差兩個(gè)月,王小川說怎么可能,如今這一答案基本明了。
ChatGPT-4 Turbo是在2023年11月7日的OpenAI開發(fā)者大會上發(fā)布,讓當(dāng)時(shí)的大模型界振聾發(fā)聵。但距離GPT上次更新已遙遙8個(gè)月,國產(chǎn)大模型在這期間分秒必爭,如今基本宣布自己已經(jīng)達(dá)到或超過ChatGPT-4 Turbo,也即意味著差距至少在半年之久。
但也有個(gè)別領(lǐng)域差異化領(lǐng)先,全球著名開源平臺huggingface(笑臉)的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clem在社交平臺宣布,阿里最新開源的Qwen2-72B指令微調(diào)版本,成為開源模型排行榜第一名。
這一成績振奮人心。不僅如此,根據(jù)排行榜的數(shù)據(jù)顯示,Meta開源的Llama-3-70B指令微調(diào)版本位列第2;阿里的Qwen2-72B基礎(chǔ)版本排名第3;第9和第10名,全部都是阿里之前開源的Qwen1.5基礎(chǔ)和Chat版本。
阿里的開源大模型不僅在前十名中占據(jù)了4個(gè)坑位,還超越了科技巨頭Meta的Llama-3-70B。Llama號稱是眾多國產(chǎn)大模型之母,不少國產(chǎn)大模型都辟謠過關(guān)系,這次終于實(shí)現(xiàn)了超越。不僅阿里通義,智譜AI也是開源路上一員猛將。智譜開源了其第四代的GLM模型—GLM-4-9B。
GLM-4-9B開源模型綜合能力相比 ChatGLM3-6B 提升 40% ,中文學(xué)科能力提升 50%,最高支持達(dá) 1 百萬 tokens 長文本,支持 26 種語言。閉源大模型的競爭更加激烈,各家最新版本紛紛稱超越ChatGPT-4 Turbo。6月21日,不走AGI、更強(qiáng)調(diào)行業(yè)落地路線的華為盤古大模型 5.0正式發(fā)布。盤古大模型 5.0 聲稱能夠更好地理解物理世界,包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。已在30多個(gè)行業(yè)、400多個(gè)場景中落地。
接下來的6月27日,科大訊飛在北京發(fā)布訊飛星火大模型V4.0。并且,訊飛星火V4.0是基于全國首個(gè)國產(chǎn)萬卡算力集群“飛星一號”訓(xùn)練而成??拼笥嶏w董事長劉慶峰稱,訊飛星火參與國內(nèi)外中英文12項(xiàng)大模型主流測試集,其中8個(gè)測試集中排名第一,超越GPT-4 Turbo等國際大模型。其在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面也實(shí)現(xiàn)對GPT-4 Turbo的超越。
雖然星火大模型在各種整體評分中,很多時(shí)候不在國產(chǎn)大模型前三甲,但有項(xiàng)能力國際領(lǐng)先,這次發(fā)布的星火語音大模型,據(jù)悉在數(shù)十個(gè)主流語種的語音識別效果層面,超過OpenAI Whisper V3,而多語種語音合成方面,星火語音大模型擬人度則已超83%。
大模型迭代熱還在繼續(xù),緊接著的6月28日,百度在Wave Summit上直接發(fā)布了大幅強(qiáng)化檢索能力的文心大模型——文心大模型4.0 Turbo。文心大模型4.0 Turbo,可以通過文心一言的網(wǎng)頁端和APP端使用,同時(shí)面向開發(fā)者提供了API支持。
文心4.0 Turbo模型強(qiáng)化了檢索能力,全網(wǎng)搜索、分析資料、等待回復(fù)這些步驟的融合,不僅提高了回答的速度,也在一定程度上緩解了大模型回答中“幻覺”的問題。
同時(shí),百度飛槳發(fā)布新一代飛槳框架3.0 Beta版本,具備大模型訓(xùn)推一體、動靜統(tǒng)一自動并行、編譯器自動優(yōu)化以及大模型多硬件適配等特色。訓(xùn)推一體的統(tǒng)一有利于推理優(yōu)化,也能降低大模型的開發(fā)成本,可以幫助大模型實(shí)現(xiàn)更快迭代。多模態(tài)領(lǐng)域,騰訊混元大模型的Di-T架構(gòu)和階躍星辰的1T-MoE多模態(tài)的感知能力,算是領(lǐng)域驚喜。
騰訊混元大模型號稱全球最早的Di-T架構(gòu),雖然大模型發(fā)布的晚,但好在架構(gòu)先進(jìn)。當(dāng)然也得感謝Sora,這個(gè)期貨產(chǎn)品,讓市場形成Di-T架構(gòu)是多模態(tài)大模型未來的共識。
階躍星辰在7月的WAIC上發(fā)布萬億級參數(shù)MoE(混合專家)大語言模型Step-2正式版,Step-1.5V多模態(tài)大模型,以及Step-1X 圖像生成大模型。對多模態(tài)大模型的Step-2理解在行業(yè)領(lǐng)先,未來表現(xiàn)值得期待。
沉睡的CV巨頭商湯也開始發(fā)力,WAIC上發(fā)布流式原生多模態(tài)交互模型——6000億參數(shù)日日新5.5系列大模型,其中5o版本有類似ChatGPT-4o類似的交互能力。
國產(chǎn)大模型們逐漸走出了“不斷追趕GPT-4”的敘事線。從技術(shù)角度看,國產(chǎn)大模型和ChatGPT-4o的差距一直在縮小,多模態(tài)領(lǐng)域甚至有了并肩前行的感覺。
AI應(yīng)用還未爆發(fā),各家爭NO.1 的口徑
“沒有應(yīng)用,開源閉源模型都一文不值?!崩顝┖曜罱l頻闡述自己的AI理念,“要跳出移動時(shí)代的思維邏輯,避免掉入“超級應(yīng)用陷阱”,不是只有10億DAU的應(yīng)用才叫成功?!痹掚m說如此,但這場AI應(yīng)用的暗戰(zhàn),沒有人會放松。
據(jù)量子位分析智庫顯示,豆包AI的6月份的APP端下載量位居榜首,達(dá)到了5000萬。文心一言的下載總量達(dá)到1400萬,暫時(shí)位列第三。但百度公布的另一維度數(shù)據(jù)是第一:文心一言用戶規(guī)模達(dá)到3億,日調(diào)用量超過了5億。這是百度Wave Summit 2024大會上公布的數(shù)字。文心一言曾在去年12月公開用戶規(guī)模首次破億;兩三個(gè)月前日均調(diào)用量也在2億。
時(shí)隔六個(gè)月,文心一言的用戶數(shù)量已翻了三倍,增長迅猛?,F(xiàn)如今,文心一言達(dá)成“每5個(gè)人中就有1個(gè)人用過”的成績,百度在發(fā)展大模型的路徑上,除了全面AI化百度系應(yīng)用,諸如百度文庫經(jīng)過AI大模型改造后,目前付費(fèi)用戶也已有2600萬。最重要的發(fā)展方向是智能體。
在WAIC上,李彥宏坦言,智能體是百度最看好的AI發(fā)展方向。智能體也是當(dāng)下AI走進(jìn)C端的最佳形象。李彥宏表示,制作智能體的門檻并不高:只需要對著大模型把工作流程講清楚,就可以生成一個(gè)有價(jià)值的智能體。
數(shù)據(jù)顯示,文心大模型星河共創(chuàng)計(jì)劃啟動一年以來,文心大模型也已經(jīng)和眾多合作伙伴、開發(fā)者一起,共創(chuàng)了55萬個(gè)AI應(yīng)用。
盡管很多AI應(yīng)用不到千個(gè)使用次數(shù),但智能體確實(shí)能實(shí)現(xiàn)多步復(fù)雜流程的AI調(diào)用。大模型產(chǎn)品化中獨(dú)樹一派的選手要屬月之暗面的Kimi和豆包App,這是少數(shù)專注To C的選手,旗下產(chǎn)品Kimi AI非常適合案頭等工作場景中應(yīng)用,支持200萬漢字的長文本輸入,主打無損記憶以及“長文本”,被網(wǎng)友稱為ChatGPT中文平替。
據(jù)量子位分析智庫數(shù)據(jù),2024年6月,Kimi智能助手月訪問總量達(dá)2200萬。Kimi智能助手APP月新增下載量超300萬,較5月增長速度提升50%。為了讓大家更方便體驗(yàn)AI。7月8日,Kimi上線了瀏覽器插件,在大模型輕量應(yīng)用上做出探索。
Kimi瀏覽器插件目前有“點(diǎn)問筆”和“總結(jié)器”兩項(xiàng)功能。和月之暗面不謀而合的是,字節(jié)跳動旗下AI助手豆包此前也推出了瀏覽器插件版本。劃線問和AI總結(jié)網(wǎng)頁,這是用戶在瀏覽網(wǎng)頁時(shí)的痛點(diǎn)需求,Monica就憑借類似的瀏覽器插件能力,獲得了幾百萬用戶。kimi和豆包瀏覽器插件,預(yù)計(jì)也能占據(jù)很大的市場。
To C賽道上,6月份最重磅的玩家,要屬騰訊旗下大模型應(yīng)用“騰訊元寶”。作為多模態(tài)大模型底座上亮相的AI對話應(yīng)用,還上線了深度搜索模式。在深度搜索模式下,元寶從深度和廣度兩方面對搜索內(nèi)容進(jìn)行拓展,并可同步至大綱、思維導(dǎo)圖、相關(guān)人物事件梳理等,幫助用戶掌握搜索內(nèi)容??拼笥嶏w董事長劉慶峰表示,自去年9月全面開放以來,訊飛星火APP在安卓公開市場累計(jì)下載量達(dá)1.31億次,在國內(nèi)工具類通用大模型App中排名第一。
這個(gè)口徑的第一,也讓訊飛星火大模型有底氣做發(fā)展路線的第三派,積極將大模型整合進(jìn)硬件等產(chǎn)品中。一方面將大模型能力落地學(xué)習(xí)機(jī)、翻譯機(jī)、辦公本等自有智能硬件;另一方面,將大模型的能力深度賦能行業(yè),正在落地汽車、家電、機(jī)器人、AI手機(jī)、AI PC等領(lǐng)域。
數(shù)據(jù)顯示,科大訊飛AI學(xué)習(xí)機(jī)獲得了2023年天貓&京東雙十一銷售額冠軍。其新推出的智能批閱機(jī)可以一分鐘掃描90份學(xué)生作業(yè),平時(shí)教師一個(gè)半小時(shí)批改的工作任務(wù)批閱機(jī)5分鐘就可以完成。走進(jìn)教育、醫(yī)療場景中的科大訊飛,已經(jīng)找到了自己的營收場景。
大模型5小虎難存活?商業(yè)化艱難的一步
6月份,梅花創(chuàng)投吳世春提到,“中國大模型五虎”想要跑出來非常難。"這句暴論在大模型圈引起了不少爭論。的確,從統(tǒng)計(jì)到的數(shù)據(jù)看,目前大模型整體的商業(yè)化還比較基礎(chǔ)。據(jù)『智能超參數(shù)』公開渠道統(tǒng)計(jì)到的數(shù)據(jù),6月份大模型相關(guān)中標(biāo)項(xiàng)目75個(gè),其中:有30個(gè)項(xiàng)目,未披露中標(biāo)金額(為方便統(tǒng)計(jì),金額以0計(jì)算),其余45個(gè)中標(biāo)項(xiàng)目披露的金額達(dá)到了1.38億元。
大模型中標(biāo)情況,來源:智能超參數(shù)
科大訊飛單月里中標(biāo)的項(xiàng)目是8個(gè),披露的中標(biāo)金額為3895萬元,百度單月中標(biāo)項(xiàng)目7個(gè),披露的中標(biāo)金額2831萬元。此外,商湯科技、阿里云、騰訊云、智譜AI等廠商也都有中標(biāo)項(xiàng)目。在AI產(chǎn)業(yè)的浪潮中,雖然表面上看似繁榮,但商業(yè)化的挑戰(zhàn)和艱難卻是不容忽視的現(xiàn)實(shí)。
以科大訊飛和百度為例,這兩家公司在單月內(nèi)中標(biāo)的數(shù)量和金額相對光鮮,但與巨大的研發(fā)投入相比,卻顯得有些杯水車薪。百度2023財(cái)報(bào)顯示,百度投入研發(fā)費(fèi)用為242億元,同比增加4%;2023年科大訊飛的研發(fā)費(fèi)用為34.81億元,同比增長11.89%,投向星火大模型的費(fèi)用規(guī)模便超20億。
且根據(jù)華為高管公布的信息,開發(fā)和一次訓(xùn)練AI大模型的成本就高達(dá)1200萬美元。從中標(biāo)項(xiàng)目中看,大模型本身商業(yè)化還比較少。2024年6月份的統(tǒng)計(jì)數(shù)據(jù)來看,應(yīng)用類和算力類的項(xiàng)目占據(jù)了絕對的主導(dǎo)地位,這兩類的占比自2023年以來一直在90%以上,且應(yīng)用類的占比還在逐漸增大。
大模型中標(biāo)類別,來源:智能超參數(shù)
因此,盡管場面熱鬧,大模型應(yīng)用的落地卻大多還處于嘗鮮、試點(diǎn)階段,同質(zhì)化現(xiàn)象嚴(yán)重,缺乏清晰的商業(yè)路徑。更壞的消息是,盡管如此,國內(nèi)大模型廠商們悄無聲息地拉開了”價(jià)格戰(zhàn)“的序幕。5月,字節(jié)跳動把Token的定價(jià)降低了一個(gè)數(shù)量級,從以分計(jì)價(jià)進(jìn)入以厘計(jì)價(jià)時(shí)代。
業(yè)內(nèi)戲言,大模型價(jià)格進(jìn)入了“厘時(shí)代”。根據(jù)火山引擎公布的價(jià)格計(jì)算,1元就能買到豆包主力模型的125萬Tokens,大約是200萬個(gè)漢字。200萬字是什么概念,大概相當(dāng)于10本書。阿里通義、百度文心、智譜等相繼開始跟進(jìn)價(jià)格戰(zhàn)。
同樣的趨勢也發(fā)生在國外。自去年以來,OpenAI已經(jīng)進(jìn)行了4次降價(jià),在OpenAI發(fā)布了最新發(fā)布的多模態(tài)大模型GPT-4o中,不僅大模型性能有了很大提升,價(jià)格也下調(diào)了50%。大模型廠商們試圖通過降低成本來推動大模型的普及和應(yīng)用。
然而,這種策略雖然能夠吸引用戶嘗試,但能否轉(zhuǎn)化為持續(xù)的商業(yè)化成功,還有待市場的檢驗(yàn)。AI大模型產(chǎn)業(yè)找到可行的商業(yè)模式,實(shí)現(xiàn)可持續(xù)的盈利,是所有AI企業(yè)需要面對的問題。