界面新聞?dòng)浾?| 陳振芳 伍洋宇
界面新聞編輯 | 文姝琪
每當(dāng)工作遇到困難的時(shí)候,梁文峰總會(huì)想起量化投資先驅(qū)西蒙斯的話:“一定有辦法對(duì)價(jià)格建模?!绷何匿h是私募基金幻方量化的實(shí)際控制人。由他創(chuàng)立的大模型公司DeepSeek在業(yè)內(nèi)被稱為“價(jià)格屠夫”,是最近這一輪大模型價(jià)格戰(zhàn)的始作俑者。
2024年5月6日,DeepSeek發(fā)布DeepSeek-V2開(kāi)源MoE模型,在市場(chǎng)毫無(wú)預(yù)見(jiàn)的情況下改變了大模型廠商格局。其API接口定價(jià)直接下探至每百萬(wàn)tokens輸入1元、輸出2元(32K上下文),價(jià)格僅為GPT-4-Turbo的近百分之一。
不出半個(gè)月,智譜AI、字節(jié)跳動(dòng)、阿里云、百度、騰訊云接連選擇跟進(jìn)降價(jià)。其中,騰訊和百度直接免費(fèi)了幾款大模型產(chǎn)品——正如梁文峰曾經(jīng)相信的那樣,由他發(fā)起的價(jià)格戰(zhàn)正在重塑整個(gè)大模型產(chǎn)業(yè)格局。
過(guò)去一年多的大模型狂熱推動(dòng)英偉達(dá)市值一路暴漲。然而,除了提供GPU的英偉達(dá)賺到了錢,大模型廠商依然在大量燒錢。每一次模型訓(xùn)練,用戶的每一次詢問(wèn),開(kāi)發(fā)者的每一次調(diào)用,都對(duì)應(yīng)一份算力消耗,每次消耗都是一筆成本賬。
這使得突如其來(lái)的降價(jià)潮更加出乎旁觀者意料?!叭ツ旮鶯P匯報(bào)時(shí),我們預(yù)測(cè)三年后才能達(dá)到現(xiàn)在的價(jià)格水平,沒(méi)想到不到一年就達(dá)到了?!币晃挥部萍纪顿Y人告訴界面新聞,降價(jià)肯定會(huì)促使AI應(yīng)用迸發(fā),只是這一天更早的到來(lái)了。
1
引領(lǐng)這輪降價(jià)潮的梁文峰被認(rèn)為是一個(gè)“攪局者”。
2008年,他從浙江大學(xué)畢業(yè),并沒(méi)有走入如火如荼的互聯(lián)網(wǎng)創(chuàng)業(yè)。在外界無(wú)從得知的幾年,傳說(shuō)他曾住在成都的出租屋,幾經(jīng)波折最終走上量化投資之路。多年后,由他主導(dǎo)建立的幻方量化成為突破千億大關(guān)的量化私募機(jī)構(gòu)。
投資和大模型有何關(guān)系?梁文峰就是兩條路上交匯的那一個(gè)點(diǎn)。不少AGI信仰者聲稱: “Scaling law”(規(guī)模法則)是通往AGI的必經(jīng)之路,即數(shù)據(jù)、算力、計(jì)算量越大,訓(xùn)練的模型越“聰明”。 而量化投資者們相信大數(shù)定律,當(dāng)樣本容量足夠大時(shí),樣本均值將趨近于總體均值。
“DeepSeek創(chuàng)始人是理想主義者。”有投資人向界面新聞如此評(píng)價(jià)。梁文峰的理想主義“財(cái)大氣粗”,帶著一萬(wàn)枚英偉達(dá)A100 GPU、在北京租賃近2000平方米場(chǎng)地,“深度求索DeepSeek”在2023年7月橫空出世,寓意“路漫漫其修遠(yuǎn)兮,吾將上下而求索”。
萬(wàn)卡不一定是DeepSeek的上限。有行業(yè)人士向界面新聞表示,這家公司或許已經(jīng)有超兩萬(wàn)枚英偉達(dá)A100 GPU。除了互聯(lián)網(wǎng)巨頭,幾乎沒(méi)有創(chuàng)業(yè)公司有如此多算力儲(chǔ)備。
在DeepSeek率先挑起價(jià)格戰(zhàn)之后,“跟還是不跟?”成為行業(yè)里每個(gè)參與者必須面對(duì)的選擇題。
最先坐不住的是掌握大量企業(yè)客戶的智譜AI。這家公司率先將對(duì)標(biāo)GPT3.5-Turb的入門(mén)級(jí)模型GLM-3 Turbo模型調(diào)用價(jià)格下調(diào)90%,由5元/百萬(wàn)tokens調(diào)整為1元/百萬(wàn)token。
隨之而來(lái)的則是從未缺席過(guò)任何一場(chǎng)行業(yè)價(jià)格戰(zhàn)的互聯(lián)網(wǎng)大廠們。
字節(jié)跳動(dòng)直接將大模型從以分計(jì)價(jià)帶到以厘計(jì)價(jià)時(shí)代。旗下的豆包通用模型pro-32k版輸入價(jià)格降至0.0008元/千Tokens,為同規(guī)格模型的1/150。
阿里云旗下的通義千問(wèn)GPT-4級(jí)主力模型宣布降價(jià)97%,API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,旗下9款商業(yè)化及開(kāi)源模型也紛紛降價(jià)。
戰(zhàn)況愈演愈烈。百度文心直接將ERNIE Speed、ERNIE Lite兩款免費(fèi)。騰訊云隨后也宣布混元大模型全面降價(jià),主力模型之一“混元-lite”從0.008元/千tokens調(diào)整為免費(fèi),API輸入輸出總長(zhǎng)度也將從目前的4k升級(jí)到256k。
然而,降價(jià)接力賽在大廠之間如火如荼,但創(chuàng)業(yè)公司的身影卻鮮少出現(xiàn)。大部分備受關(guān)注的獨(dú)角獸們均不動(dòng)聲色。
百川智能創(chuàng)始人王小川認(rèn)為,這一輪大廠降價(jià)的實(shí)質(zhì)是云廠商進(jìn)到新戰(zhàn)場(chǎng),降價(jià)是大廠射程范圍內(nèi)的事。他勸創(chuàng)業(yè)公司別把這個(gè)商業(yè)模式作為業(yè)務(wù)重點(diǎn),也別摻和進(jìn)去。
零一萬(wàn)物創(chuàng)始人李開(kāi)復(fù)的表態(tài)更早,也更強(qiáng)硬。
在這輪降價(jià)潮襲來(lái)之前,李開(kāi)復(fù)就提醒說(shuō),“不應(yīng)在行業(yè)內(nèi)按照ofo式的燒錢打法重蹈覆轍?!倍诖髲S降價(jià)的苗頭漸起后,他依然表達(dá)了不參戰(zhàn)的態(tài)度,“如果以后中國(guó)市場(chǎng)可能就是這么卷,大家寧可賠光通輸也不讓你贏,那我們就走外國(guó)市場(chǎng)?!?/p>
李開(kāi)復(fù)堅(jiān)持認(rèn)為價(jià)格戰(zhàn)是一個(gè)“雙輸”的打法,創(chuàng)業(yè)公司如果認(rèn)定自己的技術(shù)值得,就應(yīng)當(dāng)堅(jiān)持一個(gè)合適的價(jià)格,而絕不能靠貼錢、賠錢做生意。
2
大廠和創(chuàng)業(yè)公司面對(duì)降價(jià)潮態(tài)度不一的背后,是心態(tài)和資金儲(chǔ)備的全然不同。
創(chuàng)業(yè)公司的視角是更好理解的。當(dāng)前仍在牌桌上且手握大把籌碼的大模型創(chuàng)業(yè)公司,大都認(rèn)可研發(fā)和應(yīng)用的“雙輪驅(qū)動(dòng)”理論,這意味著它們既要做模型,也要做產(chǎn)品。而模型要技術(shù)人才、萬(wàn)卡集群,產(chǎn)品要投流買量、跑馬圈地,創(chuàng)業(yè)公司燒錢的日子還在后頭。
更重要的是,創(chuàng)業(yè)公司的野望在C端(個(gè)人用戶市場(chǎng))而非B端(企業(yè)市場(chǎng))?!皼](méi)有一家大模型公司靠賣API活著?!币幻P(guān)注大模型行業(yè)的FA(財(cái)務(wù)顧問(wèn))對(duì)界面新聞?dòng)浾弑硎尽?/p>
但如果選擇不參戰(zhàn),創(chuàng)業(yè)公司也無(wú)法完全無(wú)動(dòng)于衷,必須找到自己的應(yīng)對(duì)策略。
獵豹移動(dòng)董事長(zhǎng)兼CEO傅盛認(rèn)為,這次大降價(jià)基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。降的最兇的都是有云服務(wù)的大公司,通過(guò)大模型來(lái)獲取云客戶,“羊毛出在豬身上,降得起”,而大模型創(chuàng)業(yè)公司沒(méi)有這樣的生態(tài),必須另尋商業(yè)模式。
除此以外,創(chuàng)業(yè)公司還需要警惕的是,自己是否會(huì)被可能出現(xiàn)的市場(chǎng)格局變動(dòng)擠下牌桌。
活躍在投融資的FA和VC們告訴界面新聞,融到錢的創(chuàng)業(yè)公司其實(shí)已經(jīng)到了向投資人和市場(chǎng)“秀肌肉”的時(shí)刻。但技術(shù)進(jìn)展的漫漫征程擺在眼前,燒錢也燒不過(guò)大廠,當(dāng)商業(yè)化進(jìn)展不夠順利,估值處于第二、第三梯隊(duì)的創(chuàng)業(yè)公司,會(huì)面臨融資壓力陡增的境地。
“今年很多大模型初創(chuàng)公司可能會(huì)出局,”前述FA表示,“市場(chǎng)上并不需要這么多家企業(yè)?!?/p>
而對(duì)資源儲(chǔ)備雄厚的大廠而言,降價(jià)的決策其實(shí)“早有預(yù)謀”。
在這波密集動(dòng)作之前,它們幾乎已經(jīng)都在通過(guò)代金券、場(chǎng)景合作、工程優(yōu)化等各種方式,試圖降低模型利用的成本,當(dāng)前的定價(jià)也是結(jié)合技術(shù)和用戶規(guī)模預(yù)期等綜合因素考量的結(jié)果。
“坦白說(shuō),誰(shuí)的算力更充沛,誰(shuí)就會(huì)有更大的收益。”上述FA人士表示。一個(gè)可證實(shí)的數(shù)字是,據(jù)DeepSeek內(nèi)部人士消息,該公司大模型服務(wù)在降價(jià)后的利潤(rùn)率仍超50%。
“關(guān)鍵是什么時(shí)候降價(jià)?”這可能是過(guò)去一年所有云廠商都在琢磨的問(wèn)題,直到DeepSeek作為導(dǎo)火索出現(xiàn)。
從技術(shù)上來(lái)說(shuō),大模型價(jià)格戰(zhàn)打得起來(lái)的根本原因在于,模型之間的差距不大。一位投資人直言,大廠之所以跟進(jìn),是因?yàn)樵谒鼈兊囊曇爸?,DeepSeek所實(shí)現(xiàn)的架構(gòu)創(chuàng)新自己可以在短期內(nèi)達(dá)成,提前虧幾個(gè)月無(wú)所謂。
一位前互聯(lián)網(wǎng)云廠商從業(yè)人員告訴界面新聞,由于企業(yè)縮減預(yù)算,這兩年云市場(chǎng)的行情并不太好。另一方面,大模型還是沒(méi)有那么顛覆性,尤其國(guó)內(nèi)大模型還遠(yuǎn)不如國(guó)外成熟。所以,以價(jià)格換市場(chǎng)成為自然而然的選擇。
多名受訪者認(rèn)為,大廠降價(jià)的目的就是籠絡(luò)更多企業(yè)和開(kāi)發(fā)者,為自己搭建生態(tài)護(hù)城河。
一名火山引擎內(nèi)部人士告訴界面新聞:“豆包大模型降價(jià)的真實(shí)原因在于,大模型在B端的應(yīng)用還沒(méi)有起來(lái),場(chǎng)景太少?!彼赋觯m然行業(yè)在討論用AI大模型重構(gòu)業(yè)務(wù),但在日常工作生活里很少能感受到大模型能力的落地?!敖祪r(jià)本質(zhì)上是降低使用門(mén)檻。”
這個(gè)觀點(diǎn)在跟進(jìn)降價(jià)的大廠中間是共識(shí)。大模型仍然處于市場(chǎng)培育階段,降價(jià)或免費(fèi)都是為了讓更多企業(yè)和開(kāi)發(fā)者能快速用上,并接入到自己的業(yè)務(wù)場(chǎng)景中。畢竟,讓更多人參與進(jìn)來(lái)是行業(yè)發(fā)展的前提。
3
降價(jià)能不能最終帶來(lái)AI生態(tài)的繁榮?
AI應(yīng)用層的投資人對(duì)此持樂(lè)觀態(tài)度。楊泉在去年大模型公司融資勢(shì)頭最為火爆的時(shí)候,見(jiàn)過(guò)月之暗面創(chuàng)始人楊植麟,也見(jiàn)過(guò)王小川,但他所在的機(jī)構(gòu)最終沒(méi)有買下那張通用大模型的入場(chǎng)門(mén)票,而是轉(zhuǎn)向了AI應(yīng)用層。
“我跟朱嘯虎的觀點(diǎn)比較一致,所以我是樂(lè)于見(jiàn)到所謂降價(jià)潮的。”楊泉說(shuō),只有基礎(chǔ)設(shè)施的成本極低,在上面做應(yīng)用的公司才能迎來(lái)爆發(fā)。
過(guò)去移動(dòng)互聯(lián)網(wǎng)的發(fā)展已經(jīng)證明了這一點(diǎn)。當(dāng)運(yùn)營(yíng)商的網(wǎng)絡(luò)資費(fèi),云服務(wù)廠商的成本大幅下降之后,才逐漸長(zhǎng)出了微信、抖音等等超級(jí)應(yīng)用。
而大模型領(lǐng)域也許能復(fù)制這一過(guò)程。當(dāng)前在基礎(chǔ)大模型領(lǐng)域,中國(guó)公司的能力與OpenAI等美國(guó)引領(lǐng)者還有較大差距。多位投資人表示,中國(guó)彎道超車的機(jī)會(huì)在大模型應(yīng)用層。
一位美元基金硬科技投資人對(duì)中國(guó)的大模型發(fā)展更加樂(lè)觀:“中國(guó)不擅長(zhǎng)于做顛覆性的創(chuàng)新,但特別適合做增量式創(chuàng)新,或者叫‘快速跟隨者’。”
他進(jìn)一步指出,短期內(nèi),大模型領(lǐng)域的創(chuàng)新層出不窮,中美存在較大差距。但把時(shí)間拉軸拉長(zhǎng)來(lái)看,創(chuàng)新斜率總會(huì)慢慢變平,當(dāng)曲線當(dāng)變平,中國(guó)就會(huì)有機(jī)會(huì)去反超,這是在電動(dòng)車領(lǐng)域已經(jīng)發(fā)生的故事,“當(dāng)特斯拉的技術(shù)創(chuàng)新放緩,中國(guó)電動(dòng)車就追上來(lái)了。”
李飛飛團(tuán)隊(duì)也提到,中國(guó)在全球AI專利申請(qǐng)方面占據(jù)主導(dǎo)地位,美國(guó)在AI模型的發(fā)展上保持領(lǐng)先。今年上半年,中國(guó)大模型創(chuàng)業(yè)公司和互聯(lián)網(wǎng)大廠對(duì)于模型更新和產(chǎn)品發(fā)布的節(jié)奏,在戰(zhàn)術(shù)上已有對(duì)于OpenAI的全面追趕之勢(shì)。
不過(guò)也有人持不同意見(jiàn),作為一家大模型應(yīng)用初創(chuàng)公司的創(chuàng)始人,李靈昊沒(méi)有被這輪降價(jià)潮打動(dòng)。在他的觀察中,更大參數(shù)、更大模型能力的高參量模型并沒(méi)降價(jià)或者降幅不多,主要是放開(kāi)了一些低端的使用場(chǎng)景。
因此,從技術(shù)角度來(lái)說(shuō),他認(rèn)為這輪降價(jià)并沒(méi)有為下游帶來(lái)太多變化。相較而言,他們更期待的是真正的技術(shù)變革。
李靈昊認(rèn)為,但如果行業(yè)志在看到顛覆性的創(chuàng)新繁榮,大模型廠商們的最好做法,仍然是推進(jìn)Scaling Law,真正從性能上讓下游開(kāi)發(fā)者感受到何為如虎添翼。
大廠對(duì)此不是沒(méi)有認(rèn)知。百度內(nèi)部人士告訴界面新聞:“長(zhǎng)期來(lái)看,模型廠商最終競(jìng)爭(zhēng)的還是模型本身的能力,只有把基礎(chǔ)模型效果做得足夠好,才能構(gòu)筑競(jìng)爭(zhēng)壁壘。”
前述關(guān)注大模型行業(yè)的FA也指出,API價(jià)格戰(zhàn)不能代表什么,因?yàn)閮r(jià)格本身已經(jīng)足夠低了,它更多來(lái)源于技術(shù)架構(gòu)更新疊加市場(chǎng)劇烈競(jìng)爭(zhēng),“大家只是被迫卷,想先拉出身位差 ?!?/p>
不過(guò),正如投資人所預(yù)言的那樣,降價(jià)難以影響模型性能升級(jí),但有機(jī)會(huì)促使AI應(yīng)用的大迸發(fā)。
盡管王小川定義下的“超級(jí)應(yīng)用”只與“超級(jí)模型”深度綁定,正在降價(jià)的大模型API無(wú)法催促超級(jí)應(yīng)用的誕生。但在整個(gè)應(yīng)用生態(tài)中,當(dāng)大模型時(shí)代的“電價(jià)”足夠普惠,垂直應(yīng)用生態(tài)有望進(jìn)一步繁榮。
回看當(dāng)下,降價(jià)潮并不會(huì)偃旗息鼓。前述FA判斷,“價(jià)格戰(zhàn)仍未觸底,硅基流動(dòng)所引領(lǐng)的AI infra(AI 基礎(chǔ)軟件)還能將大模型的性能和價(jià)格再次‘擊穿’,只是還沒(méi)有對(duì)外發(fā)布?!薄獜倪@個(gè)角度而言,AI 2.0時(shí)代的“電力普及”或許才剛剛開(kāi)始。
發(fā)起這場(chǎng)價(jià)格戰(zhàn)的DeepSeek已經(jīng)開(kāi)始悄悄謀劃從幻方量化獨(dú)立出來(lái),醞釀成為大模型賽場(chǎng)的大玩家。理論上,梁文峰彼時(shí)會(huì)手握量化交易、大模型兩張王牌。交易出身的他,曾無(wú)數(shù)次證明過(guò)一個(gè)普通道理,即價(jià)格可以重構(gòu)市場(chǎng)。
(應(yīng)受訪者要求,李靈昊、楊泉為化名)
(界面新聞?dòng)浾咝し?、崔鵬對(duì)此文亦有貢獻(xiàn))