文|互聯(lián)網(wǎng)怪盜團(tuán)
在5月15日的火山引擎大會(huì)上,字節(jié)跳動(dòng)將自研的“云雀”大模型統(tǒng)一改名為“豆包”大模型,并一次發(fā)布了9個(gè)大模型產(chǎn)品。毫無(wú)疑問(wèn),當(dāng)前的國(guó)內(nèi)生成式AI行業(yè)還處于群雄逐鹿的混亂狀態(tài),競(jìng)爭(zhēng)格局高度不穩(wěn)定,字節(jié)跳動(dòng)在技術(shù)上并不屬于最領(lǐng)先的(就連是否屬于第一集團(tuán)都還有爭(zhēng)議);但是,憑借自己的消費(fèi)端產(chǎn)品開(kāi)發(fā)經(jīng)驗(yàn)、內(nèi)容數(shù)據(jù)儲(chǔ)備、以及管理層的重視,它已經(jīng)在國(guó)內(nèi)生成式AI市場(chǎng)占據(jù)了舉足輕重的地位。
我認(rèn)為字節(jié)跳動(dòng)的AI野心相當(dāng)龐大:它想建立一個(gè)以消費(fèi)端(C端)應(yīng)用為基礎(chǔ),橫跨C端和B端(企業(yè)端)的“大而全”的體系,然后以此為支點(diǎn),進(jìn)一步打入云計(jì)算等技術(shù)基建生態(tài)。相比之下,阿里是希望以云計(jì)算為基礎(chǔ)、以B端為突破口,對(duì)C端不是特別重視;百度是搖擺于B端和C端之間,兩邊好像都取得了一些成果,但兩邊都沒(méi)有做好;騰訊則尚未形成清晰統(tǒng)一的AI戰(zhàn)略,或許形成了但是沒(méi)有對(duì)外公開(kāi);至于華為的主要精力則是集中在硬件相關(guān)生態(tài),對(duì)于AI應(yīng)用層的實(shí)際投入有限。
基于從各種渠道獲得的信息,我們可以確信,字節(jié)跳動(dòng)賦予了AI相當(dāng)高的戰(zhàn)略定位,聚集了很多資源,并確定了未來(lái)一段時(shí)間的打法:
字節(jié)跳動(dòng)在AI技術(shù)及產(chǎn)品方面聚集了大批精兵強(qiáng)將,其中包括抖音和TikTok當(dāng)年的一些靈魂人物,這是它所能拿出的最強(qiáng)有力的陣容了。
字節(jié)跳動(dòng)的AI業(yè)務(wù)可以說(shuō)是應(yīng)用驅(qū)動(dòng)的,其C端應(yīng)用發(fā)展非??欤瑪?shù)量多、垂類(lèi)覆蓋廣,大有當(dāng)年做“移動(dòng)APP工廠”的架勢(shì)。
豆包大模型設(shè)置了極低的價(jià)格,對(duì)于國(guó)內(nèi)所有大模型創(chuàng)業(yè)公司而言是一個(gè)嚴(yán)峻沖擊,不過(guò)我們尚不知道這種沖擊的實(shí)際效果如何。
字節(jié)跳動(dòng)大模型的負(fù)責(zé)人是朱文佳,曾任TikTok產(chǎn)品技術(shù)負(fù)責(zé)人。2023年11月成立的Flow(AI應(yīng)用)部門(mén)負(fù)責(zé)人是朱駿,是原Music.ly創(chuàng)始人、原TikTok負(fù)責(zé)人;Flow移動(dòng)產(chǎn)品負(fù)責(zé)人是陸游,曾任抖音社交負(fù)責(zé)人。不久前從抖音調(diào)任剪映的張楠(女),其重要任務(wù)也是依托AI去改造剪映產(chǎn)品。上述陣容不僅是字節(jié)跳動(dòng)最拿得出手的精兵強(qiáng)將,在整個(gè)中國(guó)互聯(lián)網(wǎng)行業(yè)也堪稱(chēng)豪華。對(duì)于其他互聯(lián)網(wǎng)大廠而言,派出一線大將主管AI大模型是常見(jiàn)的,但是在AI應(yīng)用層堆積這么多大將就顯得太奢侈了。
有人會(huì)問(wèn):為什么不把這些大將用于抖音等“旗艦業(yè)務(wù)”,而要用于前途未卜的AI業(yè)務(wù)?答案很簡(jiǎn)單:因?yàn)槎兑舨辉傩枰敲炊嗳肆?,?duì)于業(yè)務(wù)領(lǐng)導(dǎo)者的素質(zhì)要求也有很大改變。上面列舉的張楠、朱駿、朱文佳、陸游等人,幾乎全是產(chǎn)品向人才,即所謂“打江山的人”;現(xiàn)在抖音大局已定,沒(méi)什么江山可以打了,要打也是作為防御一方而不是進(jìn)攻一方。在用戶滲透率見(jiàn)頂、產(chǎn)品功能和技術(shù)不需要激進(jìn)迭代的情況下,抖音最需要的是商業(yè)化人才,即“從打下的江山上收錢(qián)的人”。
過(guò)去一年多在抖音內(nèi)部地位上升的人,例如新任本地生活業(yè)務(wù)負(fù)責(zé)人浦燕子,基本都來(lái)自張利東麾下,而張利東是整個(gè)中國(guó)互聯(lián)網(wǎng)行業(yè)最成功的商業(yè)化負(fù)責(zé)人之一。抖音的商業(yè)化已經(jīng)非常成功了,在此基礎(chǔ)上若還想深挖,就要對(duì)領(lǐng)導(dǎo)團(tuán)隊(duì)進(jìn)行改組,使其從“產(chǎn)品驅(qū)動(dòng)”進(jìn)一步轉(zhuǎn)向“商業(yè)化驅(qū)動(dòng)”。AI技術(shù)及其應(yīng)用,恰恰是吸納那些從抖音退下來(lái)的“產(chǎn)品型人才”的最佳場(chǎng)所。
字節(jié)跳動(dòng)的生成式AI業(yè)務(wù)從一開(kāi)始就是應(yīng)用驅(qū)動(dòng)的。作為大模型負(fù)責(zé)人,朱文佳對(duì)朱駿雖然沒(méi)有實(shí)線匯報(bào)關(guān)系,但仍然存在虛擬匯報(bào)關(guān)系(這在字節(jié)跳動(dòng)內(nèi)部相當(dāng)常見(jiàn));在大模型統(tǒng)一改名“豆包”之后,F(xiàn)low應(yīng)用部門(mén)對(duì)AI大模型開(kāi)發(fā)的影響力可能進(jìn)一步加強(qiáng)。在其他互聯(lián)網(wǎng)大廠,大模型研發(fā)團(tuán)隊(duì)可能具備相當(dāng)高的自主性,乃至“自下而上”推動(dòng)應(yīng)用建設(shè);在字節(jié)跳動(dòng),“自上而下”的邏輯則占據(jù)主導(dǎo)地位,應(yīng)用團(tuán)隊(duì)獎(jiǎng)其需求傳導(dǎo)到了基礎(chǔ)研發(fā)團(tuán)隊(duì),由此形成高度實(shí)用的組織決策模式。
迄今為止,字節(jié)跳動(dòng)已經(jīng)推出了11款A(yù)I應(yīng)用;其中,豆包是國(guó)內(nèi)用戶最多的AI獨(dú)立應(yīng)用,其MAU可能已達(dá)到2000萬(wàn)量級(jí)。需要指出的是,這并不意味著豆包大模型(原名云雀大模型)的使用量是全國(guó)最大的,因?yàn)榘⒗锏耐x千問(wèn)、百度的文心一言均通過(guò)網(wǎng)頁(yè)端和API擁有上億級(jí)別的客戶,其API調(diào)用次數(shù)也遠(yuǎn)遠(yuǎn)高于豆包。但是如果只比較獨(dú)立APP,豆包的用戶優(yōu)勢(shì)是無(wú)可爭(zhēng)議的——這就是字節(jié)跳動(dòng)一貫的打法,以高效率的移動(dòng)應(yīng)用迭代去占領(lǐng)新興市場(chǎng)。
我們不難看出,同樣是在戰(zhàn)略上高度重視生成式AI的大廠,字節(jié)跳動(dòng)與阿里的打法完全不同。后者以阿里云為基礎(chǔ),先建立一個(gè)涵蓋閉源和開(kāi)源大模型、具備成熟開(kāi)發(fā)環(huán)境和開(kāi)發(fā)工具的完整生態(tài),以B端客戶為主攻方向,與現(xiàn)有應(yīng)用融合時(shí)也是優(yōu)先考慮釘釘這樣的To B應(yīng)用。前者則以豆包等C端APP為基礎(chǔ),先建立一個(gè)廣闊的、用戶眾多的、覆蓋各種垂類(lèi)的AI移動(dòng)APP生態(tài),然后再逐步擴(kuò)大對(duì)B端的影響力。5月15日的火山引擎發(fā)布會(huì),在一定程度上體現(xiàn)了字節(jié)跳動(dòng)對(duì)目前的C端AI進(jìn)展比較滿意,計(jì)劃加強(qiáng)對(duì)B端的進(jìn)攻了。
豆包大模型最重要的特點(diǎn)是價(jià)格低廉:與類(lèi)似水平的國(guó)產(chǎn)通用大模型相比,其Token價(jià)格要低95%以上。如果這個(gè)價(jià)格是真實(shí)的、不限量的,那么對(duì)于國(guó)內(nèi)大模型創(chuàng)業(yè)公司而言,簡(jiǎn)直是滅頂之災(zāi)!請(qǐng)注意以下事實(shí):
在現(xiàn)有的Token價(jià)格水平上,如果考慮到訓(xùn)練成本攤薄的因素,幾乎所有國(guó)產(chǎn)大模型在財(cái)務(wù)上都是虧損的。
由于國(guó)產(chǎn)大模型太多,價(jià)格戰(zhàn)愈演愈烈,有的大模型甚至是邊際虧損的:不考慮訓(xùn)練成本攤薄,只考慮推理成本,毛利率仍然是負(fù)數(shù)。
受到國(guó)內(nèi)經(jīng)濟(jì)形勢(shì)以及人力成本低廉的影響,B端客戶對(duì)大模型的價(jià)格相當(dāng)敏感,即使技術(shù)水平比較優(yōu)越的大模型也賣(mài)不出更高的價(jià)格。
雖然AI創(chuàng)投看起來(lái)很熱鬧,但是雷聲大雨點(diǎn)小,創(chuàng)業(yè)公司拿到的錢(qián)很少(其中很大一部分還以算力形式支付),根本沒(méi)有本錢(qián)打價(jià)格戰(zhàn)。
假如豆包真的打穿了大模型的“地板價(jià)”并且堅(jiān)持執(zhí)行下去,其他互聯(lián)網(wǎng)大廠肯定也會(huì)跟進(jìn),那么國(guó)產(chǎn)大模型創(chuàng)業(yè)賽道可能迎來(lái)一場(chǎng)浩劫。只有大廠才能在這種不計(jì)成本的消耗戰(zhàn)當(dāng)中幸存,絕大多數(shù)創(chuàng)業(yè)公司難逃垮掉或被整合的命運(yùn)!這就是用C端應(yīng)用思維做B端產(chǎn)品的可怕之處,至于這套思維在長(zhǎng)期是不是可持續(xù),那又是另一個(gè)問(wèn)題了。反正字節(jié)跳動(dòng)燒得起錢(qián),其他大廠也跟得起,只有小公司受傷的世界達(dá)成了?
至于豆包大模型的技術(shù)水平如何,倒不是一個(gè)特別重要的問(wèn)題。很多人會(huì)疑惑,字節(jié)跳動(dòng)生成式AI部門(mén)的人員背景相當(dāng)龐雜,其中僅有極少數(shù)具備真正的AI技術(shù)背景,而且是“應(yīng)用驅(qū)動(dòng)”的——這是否天然不利于大模型技術(shù)開(kāi)發(fā)?不過(guò),在國(guó)內(nèi)現(xiàn)有環(huán)境下,哪怕豆包大模型的技術(shù)水平不領(lǐng)先,也不影響其業(yè)務(wù)應(yīng)用在短期的蓬勃發(fā)展。我們需要意識(shí)到:
與國(guó)內(nèi)最先進(jìn)的一些大模型(名字就不點(diǎn)了)相比,豆包的最新版本可能有10%左右的效率差距。但是對(duì)于C端用戶而言,這種差距不太明顯;對(duì)于B端用戶而言,巨大的價(jià)格優(yōu)勢(shì)足以彌補(bǔ)這一點(diǎn)技術(shù)差距。
國(guó)內(nèi)大模型創(chuàng)業(yè)公司在產(chǎn)品、商務(wù)、二次開(kāi)發(fā)等層面上,普遍處于“草臺(tái)班子”階段,能夠把大模型研發(fā)做好已屬不易。無(wú)論面向C端還是B端用戶,與字節(jié)跳動(dòng)等武裝到牙齒的大廠相比,它們的天然劣勢(shì)十分明顯。
國(guó)內(nèi)部分大模型的領(lǐng)先,并不是OpenAI那種劃時(shí)代意義的領(lǐng)先,而是在小地方當(dāng)老大而已。與GPT-4相比,國(guó)產(chǎn)大模型作為一個(gè)整體的落后幅度很大。既然如此,豆包與它們的短期技術(shù)差距也不是什么大不了的事情。
字節(jié)跳動(dòng)的AI野心能否成功,取決于國(guó)內(nèi)生成式AI應(yīng)用的發(fā)展大勢(shì):它最早取得突破、實(shí)現(xiàn)良性循環(huán)的領(lǐng)域,如果是B端,那么阿里無(wú)疑將取得較大優(yōu)勢(shì),百度也有機(jī)會(huì);如果是C端,那么字節(jié)跳動(dòng)的優(yōu)勢(shì)將相當(dāng)明顯。在前一種場(chǎng)景下,國(guó)內(nèi)大模型創(chuàng)業(yè)公司或許還能通過(guò)對(duì)垂直應(yīng)用的理解和定制開(kāi)發(fā)能力,占據(jù)一席之地;在后一種場(chǎng)景下,成熟的互聯(lián)網(wǎng)大廠將會(huì)一手遮天,AI將不會(huì)促進(jìn)行業(yè)“再平衡”,而只會(huì)加固極少數(shù)巨頭的地位。
還有一個(gè)問(wèn)題,不僅對(duì)字節(jié)跳動(dòng)很重要,對(duì)整個(gè)行業(yè)都很重要,那就是算力問(wèn)題。我在上文刻意忽略了這個(gè)問(wèn)題,因?yàn)槲也恢涝趺唇獯?。所有?guó)內(nèi)互聯(lián)網(wǎng)大廠都儲(chǔ)備了一定量級(jí)的AI訓(xùn)練及推理算力;具體到字節(jié)跳動(dòng),不僅自身有較大的算力儲(chǔ)備,還從阿里云租用了大量算力。可是如果AI應(yīng)用真能取得上億級(jí)別的MAU,乃至像抖音那樣成為頭部C端應(yīng)用,目前全國(guó)的算力儲(chǔ)備都是遠(yuǎn)遠(yuǎn)不夠的。許多用戶已經(jīng)注意到了,一些國(guó)內(nèi)AI聊天應(yīng)用經(jīng)常出現(xiàn)提問(wèn)需要排隊(duì)的現(xiàn)象,這就是算力不足的一個(gè)體現(xiàn)。這種算力瓶頸是不能依靠砸錢(qián)去解決的,因?yàn)楣?yīng)商已經(jīng)不再收錢(qián)了。
在可見(jiàn)的未來(lái),如果我們還是無(wú)法以合理的成本解決算力問(wèn)題,那么生成式AI在國(guó)內(nèi)的C端應(yīng)用的道路將會(huì)很窄,因?yàn)橥评硭懔赡苤粔驖M足少數(shù)專(zhuān)業(yè)化的B端客戶的需求(價(jià)格也會(huì)被推得很高)。這樣的問(wèn)題顯然不是字節(jié)跳動(dòng)或任何一家互聯(lián)網(wǎng)大廠所能解決、所應(yīng)該考慮的。我希望它能得到妥善解決,盡管我完全不知道怎么解決。