文|雷達(dá)財(cái)經(jīng) 肖灑
編輯|深海
大模型賽道,開(kāi)啟殘酷價(jià)格戰(zhàn)。
5月21日,阿里云宣布通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,直降97%。隨后百度智能云也宣布,百度文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費(fèi),立即生效。
此前,字節(jié)跳動(dòng)已宣布旗下豆包主力模型在企業(yè)市場(chǎng)的定價(jià)只有0.0008元/千Tokens,0.8厘就能處理1500多個(gè)漢字,比行業(yè)價(jià)格便宜99.3%。除此此外,幻方、智譜也官宣了新的價(jià)格體系。
這樣的趨勢(shì),同樣也在國(guó)外發(fā)生。OpenAI在剛剛結(jié)束的春季功能更新會(huì)上,宣布了其最新模型GPT-4o,不僅性能有大幅提升,所有用戶均可免費(fèi)使用。
業(yè)內(nèi)普遍的認(rèn)識(shí)是,此輪價(jià)格戰(zhàn)的主要目的是把“蛋糕做大”,推動(dòng)大模型使用進(jìn)入快速增長(zhǎng)階段。但對(duì)于一些規(guī)模較小、實(shí)力較弱的模型提供商來(lái)說(shuō),價(jià)格戰(zhàn)往往會(huì)導(dǎo)致利潤(rùn)空間的壓縮,可能會(huì)在這場(chǎng)競(jìng)賽中被淘汰“出局”。
大模型掀起“價(jià)格戰(zhàn)”
經(jīng)過(guò)2023年大模型領(lǐng)域的摸索,由ChatGPT帶熱的AI大模型,在今年走到了終端應(yīng)用時(shí)代。隨著競(jìng)爭(zhēng)加劇,單純的技術(shù)競(jìng)爭(zhēng)之外,“價(jià)格力”成為國(guó)內(nèi)外廠商比拼的關(guān)鍵一環(huán)。
其中廣受矚目的是,5月14日OpenAI召開(kāi)春季發(fā)布會(huì),正式推出新一代旗艦AI模型“GPT-4o”,不僅在功能上大幅超越GPT-4 Turbo,在價(jià)格上更是帶來(lái)驚喜。
據(jù)官方介紹,新模型GPT-4o用戶不用注冊(cè),功能全部免費(fèi)。在此之前,ChatGPT的免費(fèi)用戶只能使用GPT-3.5。而更新后,用戶可以免費(fèi)使用GPT-4o來(lái)進(jìn)行數(shù)據(jù)分析、圖像分析、互聯(lián)網(wǎng)搜索、訪問(wèn)應(yīng)用商店等操作。
當(dāng)然,免費(fèi)的前提被限制在一定的消息數(shù)量上,一旦超過(guò)規(guī)定數(shù)量,免費(fèi)用戶的模型將被切換回GPT-3.5。而付費(fèi)用戶將獲得更高的消息數(shù)量,至少是免費(fèi)用戶的5倍。
國(guó)產(chǎn)大模型在價(jià)格競(jìng)爭(zhēng)方面,也不甘落后。5月6日,私募巨頭幻方量化旗下的AI公司推出了第二代MoE模型DeepSeek-V2,其API(應(yīng)用程序編程接口)定價(jià)為每百萬(wàn)token輸入1元、輸出2元(32K上下文),僅是GPT-4的近百分之一水平。
5月11日,智譜大模型官宣新的價(jià)格體系,入門級(jí)產(chǎn)品GLM-3 Turbo模型調(diào)用價(jià)格從5元/百萬(wàn)Tokens降至1元/百萬(wàn)Tokens,降幅高達(dá)80%。
隨后的5月15日,首次對(duì)外公布大模型產(chǎn)品的字節(jié)跳動(dòng),就主動(dòng)打起了價(jià)格戰(zhàn)。據(jù)悉,字節(jié)發(fā)布的自研大語(yǔ)言模型“豆包大模型”,其豆包Pro 32k模型正式定價(jià)是1千Tokens 0.8厘,比行業(yè)的價(jià)格降低99.3%;豆包Pro 128k模型正式定價(jià)為是1千Tokens5厘錢,較行業(yè)價(jià)格降低了95.8%。
對(duì)此,火山引擎總裁譚待解釋稱,一方面,字節(jié)可以在大模型產(chǎn)品上做到低價(jià),在模型結(jié)構(gòu)、訓(xùn)練、生產(chǎn)等技術(shù)層面有很多優(yōu)化手段能夠?qū)崿F(xiàn)降價(jià),另一方面則是因?yàn)槭袌?chǎng)對(duì)降價(jià)呼聲比較大。
字節(jié)跳動(dòng)之后,其他互聯(lián)網(wǎng)大廠紛紛跟進(jìn)。5月21日,阿里云也加入大模型價(jià)格戰(zhàn),宣布通義千問(wèn)9款商業(yè)化和開(kāi)源模型降價(jià)。
據(jù)了解,這9款大模型整體推理輸入價(jià)格降幅為67%-97%,有2款開(kāi)源模型提供七天免費(fèi)優(yōu)惠。
其中,通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格,從0.02元每千tokens(大模型文本中的最小單位)降至0.5厘每千tokens,降幅為97%。
這意味著,1塊錢可以買200萬(wàn)tokens,相當(dāng)于5本《新華字典》的文字量。此外,不久前發(fā)布的通義千問(wèn)旗艦款大模型Qwen-Max,API輸入價(jià)格降至0.04元/千tokens,降幅達(dá)67%。
僅僅數(shù)小時(shí)之后,5月21日下午,百度在其公眾號(hào)發(fā)文稱,文心大模型兩大主力模型ERNIE Speed和ERNIE Lite全面免費(fèi)。
百度這兩款大模型發(fā)布于今年3月,支持8K和128K上下文長(zhǎng)度。按照過(guò)去的定價(jià),ERNIE Lite輸入0.003元/千token,輸出0.006元/千token。ERNIE Speed價(jià)格為輸入0.004元/千token,輸出0.008元/千token。
至此,群雄競(jìng)逐的大模型價(jià)格戰(zhàn)正式進(jìn)入白熱化。
廠商忙于“做大蛋糕”
在大模型這樣“燒錢”的行業(yè),偏偏打起了價(jià)格戰(zhàn),原因何在?加快商業(yè)化落地或是主要目的。
“池塘有多大,魚(yú)就有多大,現(xiàn)在整個(gè)池塘還在培養(yǎng)的過(guò)程?!弊T待表示,目前大模型仍處于百家爭(zhēng)鳴的狀態(tài),需要大家一起實(shí)現(xiàn)應(yīng)用落地、降低成本,讓更多人受益。
阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光也稱,阿里云這次大幅降低大模型推理價(jià)格,目的就是希望加速AI應(yīng)用的爆發(fā)。阿里云預(yù)計(jì)未來(lái)大模型API的調(diào)用量會(huì)有成千上萬(wàn)倍的增長(zhǎng)。
目前來(lái)看,相比缺乏付費(fèi)意愿的C端用戶,B端企業(yè)服務(wù)仍是大模型目前最主流的商業(yè)化路徑。
國(guó)際數(shù)據(jù)公司IDC曾在2023年四季度開(kāi)展過(guò)一次AI應(yīng)用調(diào)研,結(jié)果顯示,在100家受調(diào)企業(yè)中,對(duì)生成式AI完全沒(méi)有規(guī)劃的企業(yè)比例只有7%,這也意味著超九成被調(diào)查企業(yè)已布局了AI應(yīng)用。
5月16日,在百度2024年第一季度財(cái)報(bào)電話會(huì)上,百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏透露,繼上季度與中國(guó)三星、榮耀合作后,本季度,小米、OPPO、vivo等手機(jī)廠商均接入文心大模型API。
李彥宏表示,大模型的合作領(lǐng)域還在從手機(jī)向PC和電動(dòng)汽車領(lǐng)域拓展,聯(lián)想和蔚來(lái)汽車也在季度內(nèi)與達(dá)成合作。
其中率先投入使用的生成式AI,已幫助相關(guān)企業(yè)實(shí)現(xiàn)增收。愛(ài)奇藝第一季度在線廣告營(yíng)收15億元,同比增長(zhǎng)6%。其中,效果廣告營(yíng)收同比兩位數(shù)增長(zhǎng)。這主要得益于生成式AI賦能廣告提質(zhì)增效,AI制作廣告素材帶動(dòng)游戲、短劇等行業(yè)廣告主投資回報(bào)率提升超50%。
字節(jié)跳動(dòng)的AI路線圖一直頗為神秘,從目前披露的信息來(lái)看,豆包大模型已經(jīng)在字節(jié)跳動(dòng)內(nèi)部多個(gè)業(yè)務(wù)場(chǎng)景落地,包括基于豆包大模型打造AI對(duì)話助手“豆包”、AI應(yīng)用開(kāi)發(fā)平臺(tái)“扣子”、互動(dòng)娛樂(lè)應(yīng)用“貓箱”,以及星繪、即夢(mèng)等AI創(chuàng)作工具,并把大模型接入抖音、番茄小說(shuō)、飛書、巨量引擎等50余個(gè)業(yè)務(wù)。
目前,豆包App已在蘋果APP Store和各大安卓應(yīng)用市場(chǎng)可下載。
值得一提的是,聲稱性能已居國(guó)內(nèi)第一梯隊(duì)的騰訊混元大模型,同樣將“產(chǎn)業(yè)實(shí)用”作為發(fā)展大模型的核心戰(zhàn)略。
騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生介紹稱,騰訊發(fā)展大模型的核心戰(zhàn)略是“產(chǎn)業(yè)實(shí)用”,“構(gòu)建起離產(chǎn)業(yè)最近的AI,助力千行百業(yè)智能化升級(jí)”。
據(jù)了解,騰訊云智能行業(yè)大模型也已在金融、醫(yī)療、教育、汽車、能源等20多個(gè)行業(yè)落地。此外,騰訊還將于5月30日發(fā)布基于混元大模型、面向C端的助手APP“騰訊元寶”。
截至目前,騰訊大模型似乎還未參與到眼下的“價(jià)格戰(zhàn)”中來(lái)。
成本困境仍有待解決
在不斷擊穿底價(jià)甚至免費(fèi)的“激進(jìn)”策略下,大模型廠商“跑馬圈地”的意圖明顯。但在價(jià)格降至“白菜價(jià)”后,還能否覆蓋掉昂貴的訓(xùn)練成本?
從成本的角度來(lái)看,大模型的訓(xùn)練和維護(hù)成本非常高昂。據(jù)媒體報(bào)道,Gemini Ultra的訓(xùn)練成本高達(dá)1.91億美元,而GPT-4的開(kāi)發(fā)成本估計(jì)為7800萬(wàn)美元。
除此之外,大模型提供服務(wù)時(shí)還大量消耗其他資源。據(jù)《紐約客》雜志引援國(guó)外研究機(jī)構(gòu)報(bào)告,ChatGPT每天要響應(yīng)大約2億個(gè)請(qǐng)求,在此過(guò)程中消耗超過(guò)50萬(wàn)度電力。
加州大學(xué)河濱分校研究顯示,ChatGPT每與用戶交流25-50個(gè)問(wèn)題,就可消耗500毫升的水。
毫無(wú)疑問(wèn),大模型的高昂成本增加變現(xiàn)難度。在行云集成電路創(chuàng)始人季宇看來(lái),大模型的商業(yè)落地與早期互聯(lián)網(wǎng)時(shí)代相比區(qū)別很大,邊際成本仍然非常高。大模型每增加一個(gè)用戶,基礎(chǔ)設(shè)施需增加的成本是肉眼可見(jiàn)的,一個(gè)月幾十美元的訂閱費(fèi)用根本不足以抵消背后高昂的成本。
在此背景下,目前市場(chǎng)上主要的大模型參與者,都在通過(guò)技術(shù)優(yōu)化等方式不斷推動(dòng)訓(xùn)練成本的降低,以加速大模型的商業(yè)化落地。
以字節(jié)豆包大模型為例,譚待坦言降價(jià)的背后主要原因是技術(shù)上可以實(shí)現(xiàn),未來(lái)還有很多手段繼續(xù)降低成本。
據(jù)其介紹,火山引擎在技術(shù)上有非常多優(yōu)化手段,可以降低大模型成本,此外在工程上可以通過(guò)分布式推理的形式將底層算力使用得更好;另外,在混合調(diào)度方面,可以把不同負(fù)載作為混合調(diào)度,這樣的成本也大幅下降。
銀河證券研報(bào)認(rèn)為,DeepSeek-V2提升數(shù)據(jù)集質(zhì)量及優(yōu)化架構(gòu),大幅提升訓(xùn)練效率,降低訓(xùn)練成本,訓(xùn)練所需計(jì)算量約為GPT-4的1/20,但性能上基本相差無(wú)幾。
不過(guò),并非所有人都認(rèn)同簡(jiǎn)單粗暴的“價(jià)格戰(zhàn)”打法?!按竽P蛷挠?xùn)練到服務(wù)都很昂貴,算力緊缺是這一賽道的集體挑戰(zhàn),行業(yè)應(yīng)當(dāng)共同避免陷入不理性的ofo式流血燒錢打法,讓大模型能夠健康地蓄能長(zhǎng)跑?!绷阋蝗f(wàn)物 CEO 李開(kāi)復(fù)稱。
北京智源人工智能研究院院長(zhǎng)王仲遠(yuǎn)也認(rèn)為,大模型卷價(jià)格是一把雙刃劍,價(jià)格降低有利于產(chǎn)業(yè)普及和推廣,但如果價(jià)格低于企業(yè)實(shí)際成本,將擾亂市場(chǎng)。
更值得關(guān)注的是,對(duì)于資金雄厚的大廠而言,降價(jià)將能夠擴(kuò)大用戶群體,從而進(jìn)一步平衡收入和成本。但對(duì)于資金緊張的創(chuàng)業(yè)公司,價(jià)格戰(zhàn)可能就是讓企業(yè)淘汰出局的致命一擊。
時(shí)至今日,大模型仍屬于新興事物,其商業(yè)化是一個(gè)復(fù)雜且充滿挑戰(zhàn)的過(guò)程,企業(yè)想要跳出“燒錢”的怪圈還需更多的嘗試。