文|光錐智能 郝鑫
編輯|王一粟
光錐智能獲取最新獨家消息,繼2023年8月首發(fā)后,今年4月,字節(jié)跳動旗下的大語言模型云雀大模型即將迎來重要版本的升級更新。
八個月一次的更新頻率放在大模型市場確實少見,在這樣內(nèi)卷的大模型中,字節(jié)顯得有些另類,沖刺迅猛如百川智能,前期平均一個月發(fā)布升級一款大模型。
但回顧過去一年,字節(jié)并不甘愿躺平,與國內(nèi)外大模型公司“先通用大模型,后產(chǎn)品應(yīng)用”的思路不同,素有“應(yīng)用工廠”的字節(jié)選擇在有一個云雀大模型的基礎(chǔ)上,狠、準(zhǔn)、快地押注AI原生應(yīng)用。
先是從組織層面著手,2023年下半年,字節(jié)開始整合大模型團(tuán)隊和其他業(yè)務(wù)小組,成立專注于AI創(chuàng)新業(yè)務(wù)的新部門Flow,部門也成為字節(jié)在AI技術(shù)研究和研發(fā)產(chǎn)品的排頭兵。
再是像一架龐大制造機(jī)器,半年多的時間里,字節(jié)瘋狂地向國內(nèi)外市場輸送了十幾款A(yù)I產(chǎn)品;與此同時,也在產(chǎn)品研發(fā)過程中積累和發(fā)表了一批圖像生成、視頻生成的基礎(chǔ)技術(shù)研究成果。
如今,字節(jié)就像是在產(chǎn)品和市場領(lǐng)域摸爬滾打完一圈后回來,帶著更多元化的視角來審視基礎(chǔ)大模型本身。
作為互聯(lián)網(wǎng)新貴,字節(jié)沒有經(jīng)歷過2016年興起的大廠AI實驗室浪潮,反而是用AI算法技術(shù)和圖文、視頻結(jié)合,相繼創(chuàng)造出了今日頭條和抖音的爆款應(yīng)用。
據(jù)最新披露,字節(jié)2023年Q3營收309億美元,已經(jīng)超過了騰訊。新王登基后,擺在字節(jié)面前的問題也很清晰,如何利用自己的優(yōu)勢補(bǔ)齊落下的課,趕上新一波的AI浪潮?
AI應(yīng)用制造工廠,半年上線十一款產(chǎn)品
“加強(qiáng)危機(jī)感,始終創(chuàng)業(yè),逃逸平庸的重力”,2024年伊始,字節(jié)CEO梁汝波就定下了全年的目標(biāo)。
要說最貼合梁汝波所說的創(chuàng)業(yè)屬性的,莫過于字節(jié)去年成立的Flow。
去年8月云雀大模型正式發(fā)布,并同時宣布開始對外測試AI對話產(chǎn)品“豆包”,字節(jié)立即奔赴至下一個應(yīng)用的戰(zhàn)場,云雀大模型逐漸隱去在了鋪天蓋地的消息中,轉(zhuǎn)而成為了豆包等一系列AI產(chǎn)品背后的“底座”。
九月份,字節(jié)新成立的Flow接棒成為主力。據(jù)公開報道信息梳理,字節(jié)抽調(diào)了大量高管人才掌舵,大模型團(tuán)隊的負(fù)責(zé)人朱文佳同時負(fù)責(zé)Flow的業(yè)務(wù)線,字節(jié)技術(shù)副總裁洪定坤負(fù)責(zé)Flow的技術(shù)線,字節(jié)產(chǎn)品與戰(zhàn)略副總裁朱駿負(fù)責(zé)該部門的產(chǎn)品線,同時還有飛書的產(chǎn)品副總裁齊元俊加盟。
(光錐智能根據(jù)公開報道梳理制成)
在字節(jié)大舉進(jìn)軍之下,實現(xiàn)了多個應(yīng)用,多點開花的局面。據(jù)光錐智能不完全統(tǒng)計,從去年八月到現(xiàn)在,半年多的時間內(nèi),字節(jié)在海內(nèi)外共測試、上線了十一款A(yù)I應(yīng)用產(chǎn)品,一款圖像類的產(chǎn)品Picpic還未上線,這其中由Flow團(tuán)隊主導(dǎo)研發(fā)的產(chǎn)品有八款。
從產(chǎn)品類型來看,字節(jié)選擇的方向主要集中在Chatbot、虛擬角色、Agent和圖像四個主要方向,基本覆蓋了去年大火的應(yīng)用層創(chuàng)業(yè)方向,比如Chatbot領(lǐng)域有一騎絕塵的效率產(chǎn)品 ChatGPT,虛擬角色領(lǐng)域有用戶數(shù)量可觀的Character.AI,Agent方向上有OpenAI推出的GPTs等等。
多個方向出擊,遍地開花,這樣的畫面仿佛一夜又回到了抖音誕生的前夕。入局AI應(yīng)用賽道,字節(jié)再次采用了“內(nèi)部賽馬”的策略,國內(nèi)通過云雀大模型提供能力,國外基于GPT提供服務(wù)。很多時候把海外當(dāng)試驗田,先國內(nèi)一步上線類似的產(chǎn)品,去跑市場和用戶數(shù)據(jù),為國內(nèi)上線作準(zhǔn)備。
此外,字節(jié)也很清楚自身的優(yōu)勢在哪里,抖音和Tiktok兩個流量大池,天然成為了字節(jié)引流和拉新的利器。據(jù)光錐智能觀察,字節(jié)專門開設(shè)了豆包的“帶貨直播間”,向進(jìn)入直播間的用戶介紹豆包的功能,宣傳可免費下載App。此外,字節(jié)也邀請了大量的抖音達(dá)人為豆包站臺,在段子里植入了豆包的新功能。
或許正是因為流量的牽引,發(fā)布時間晚的豆包在認(rèn)知度和月活上已經(jīng)超過了百度的文心一言。據(jù)報道,有消息人士透露豆包的月活已于去年12月增長至200萬,2024年1月份則在此基礎(chǔ)上翻了一番,豆包的月內(nèi)平均日活已經(jīng)完成了對文心一言的反超。
從字節(jié)自身業(yè)務(wù)角度來看,除了Flow,飛書、剪映、字節(jié)新加坡公司、巨量引擎、大力教育等多個部分也在試水和上線AI工具和產(chǎn)品。自從Sora問世以后,AI視頻賽道再燃戰(zhàn)火,字節(jié)的剪映業(yè)務(wù)也被寄與了厚望,張楠辭任抖音集團(tuán)CEO一職領(lǐng)隊剪映團(tuán)隊,從目前來看,剪映已經(jīng)上線了 AI 克隆音色、AI 作圖、AI 繪畫、AI 生成口播等功能。
字節(jié)在 AI 視頻上推出產(chǎn)品也許只是早晚的事情,在技術(shù)儲備方面,字節(jié)已經(jīng)積累了視頻生成模型MagicVideo-V2、視頻編輯Boximator、視頻生成研究 PixelDance,并從谷歌視頻生成模型團(tuán)隊挖過來了對口人才。
已有消息稱,字節(jié)正在AI大模型領(lǐng)域秘密研發(fā)多個產(chǎn)品,其中包括多模態(tài)數(shù)字人產(chǎn)品以及AI生圖、AI生視頻產(chǎn)品。
字節(jié)不急于改舊業(yè)務(wù),而利用單點的能力放射去內(nèi)部賽馬,一方面是為了測試市場,一方面也在探索如何把AI嵌入到原有的業(yè)務(wù)流中。
比如在飛書業(yè)務(wù)線中推出了“智能伙伴”,用Agent的技術(shù)來改變傳統(tǒng)的工作流,實現(xiàn)辦公場景下的內(nèi)容創(chuàng)作、內(nèi)容總結(jié)、數(shù)據(jù)分析等功能,達(dá)到個人和企業(yè)的降本增效。哪些地方要發(fā)揮 Agent的能力,哪些地方要運用文生圖的能力,哪些場景要調(diào)用對話推理的能力,這些都要在落地過程中去檢驗。
飛書CEO謝欣曾在發(fā)布會上表示,未來AI的能力一定會變得非常強(qiáng)大,各行各業(yè)都會發(fā)生巨大變革。但目前AI能力還很有限,不一定能讓每一項任務(wù)都如期所愿,“當(dāng)下更重要的是先讓自己做到AI Ready”。
重回主戰(zhàn)場,補(bǔ)課大模型
梁汝波在2023年底年會上反思,“字節(jié)對技術(shù)的敏感度不如創(chuàng)業(yè)公司,直到2023年才開始討論GPT。而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的?!?/p>
梁汝波的言外之意是,字節(jié)的大模型慢了。
去年3月百度發(fā)布文心一言,隨后華為、阿里迅速跟進(jìn)發(fā)布大模型,而直到8月中旬,抖音云雀大模型才姍姍來遲。
關(guān)于字節(jié)大模型團(tuán)隊消息,最早可追溯至去年1月份,36氪曾報道,字節(jié)在當(dāng)時組建了首個大模型團(tuán)隊,包括語言大模型團(tuán)隊和圖片大模型團(tuán)隊。其中,語言大模型團(tuán)隊由字節(jié)搜索部門牽頭,圖片大模型團(tuán)隊由產(chǎn)品研發(fā)與工程架構(gòu)部下屬的智能創(chuàng)作團(tuán)隊牽頭。
彼時,ChatGPT和Midjourney都已經(jīng)爆火出圈?;蛟S是看到了這兩類背后路徑不同的產(chǎn)品,再考慮到旗下的一系列產(chǎn)品如何改造,字節(jié)從最初組建團(tuán)隊,就選擇了技術(shù)、產(chǎn)品兩條腿走路。但大模型是大部分AI應(yīng)用的底座,想要研發(fā)產(chǎn)品首先得有一個大模型。
云雀大模型正好承擔(dān)了這樣的角色,大模型剛一落地,字節(jié)就迅速同時開啟了AI應(yīng)用研發(fā),但大模型性能上的不成熟,也一定程度上影響了AI應(yīng)用的落地。
首先是從時間線上來看,相同功能的產(chǎn)品,國外上線的時間要早于國內(nèi),比如類GPTs平臺扣子國內(nèi)開放時間比國外滯后了兩個月。即便國內(nèi)的扣子上線后,但還是有很多中國用戶選擇國外版的Coze,原因在于可以直接調(diào)用 GPT-4 turbo的能力。
模型能力的高低之分,也會體現(xiàn)在產(chǎn)品的使用效果上,比如近期剪映海外版CapCut也推出了文生成視頻功能,但有用戶反饋,該功能在視頻清晰度、對提示詞理解和生成等待時間方面都差強(qiáng)人意。
這就導(dǎo)致了,在產(chǎn)品戰(zhàn)場大殺四方的字節(jié),不得不回過頭來補(bǔ)課大模型。
不過對字節(jié)而言,對標(biāo)OpenAI 沒有太大意義,思考適合自己的大模型路線才是出路。
從公開資料來看,字節(jié)在AI方向的發(fā)力點還是集中在圖像、視頻領(lǐng)域。大模型方面,字節(jié)目前推出了通用大語言模型云雀和支持文本、圖像、音頻三種模態(tài)的多模態(tài)大模型BuboGPT;圖像視覺方向上,去年推出的MagicVideo-V2視頻生成模型曾經(jīng)在國內(nèi)外掀起了一波熱度,可以實現(xiàn)讓靜態(tài)圖片中的人物動起來。字節(jié)之后的研究繼續(xù)在視頻方向上延伸,包括如何通過輸入文本控制人物動作,如何增進(jìn)視頻的動態(tài)效果等。
(光錐智能根據(jù)公開報道梳理制成)
由此看來,字節(jié)還是借鑒了OpenAI的做法,也就是在GPT大模型之外,把各種單點能力拉到最滿——語音方向有Whisper模型,圖像方向有DALL·E系列,視頻方向有Sora。
由于單點能力的突破也依賴于底層大模型的能力,特別是Sora提供了一種思路,即Transformer大模型架構(gòu)可以與圖像生成模型相結(jié)合,這意味著大模型的推理、理解能力會影響最后的視頻生成邏輯。所以,在基礎(chǔ)大模型上,包括字節(jié)在內(nèi)的所有大模型公司,都依然不能忽視。
除了在視頻模型上補(bǔ)足能力,字節(jié)也從團(tuán)隊人才配置上下足了功夫。組建初期,抽調(diào)原新加坡負(fù)責(zé)TikTok技術(shù)負(fù)責(zé)人朱文佳帶領(lǐng)大模型團(tuán)隊,后又令其同時負(fù)責(zé)Flow的業(yè)務(wù)線。一個排頭兵性質(zhì)的部門Flow,集結(jié)了字節(jié)的技術(shù)副總裁、產(chǎn)品與戰(zhàn)略副總裁、飛書產(chǎn)品副總裁。近期,又被曝出谷歌視頻生成模型VideoPoet研究負(fù)責(zé)人蔣路加入了智能創(chuàng)作團(tuán)隊,據(jù)悉,VideoPoet的思路與Sora世界模型的思路有很大的相似性。
Sora爆火后,有不少人將抖音前CEO張楠親自帶隊的剪映與其相提并論,但實際上,張楠仍然是更側(cè)重于產(chǎn)品層面。而真正的字節(jié)版Sora,必須要在上述這些科學(xué)家和技術(shù)負(fù)責(zé)人帶隊的團(tuán)隊中誕生。
廣告&云業(yè)務(wù),AI對字節(jié)的影響比想象中更大
去年一年,字節(jié)跳動創(chuàng)始人張一鳴將主要精力都花在了AI上,這對于受益于上一代AI技術(shù)(推薦算法)的最大受益者來說,的確具有不同凡響的重要意義。
AIGC最終生成的是內(nèi)容,天然就是對內(nèi)容生產(chǎn)形式的變革。相對于其他公司原有的電商、搜索、社交等業(yè)務(wù)屬性,抖音的基因本身就是內(nèi)容,因此,這波大模型浪潮對字節(jié)的戰(zhàn)略意義,可能會遠(yuǎn)大于其他公司。
雖然,ChatGPT-4 誕生剛滿一年,大模型和 AIGC 技術(shù)落地產(chǎn)業(yè)僅邁出了第一步,但是關(guān)于未來公司業(yè)務(wù)增長的想象力或許才剛打開。
以百度為例,其剛發(fā)布的2023年全年財報數(shù)據(jù)顯示,AI 已經(jīng)給百度帶來了實際的效益。All in 大模型的這一年,讓百度搜索、廣告等老業(yè)務(wù)煥發(fā)生機(jī),曾經(jīng)低迷的云計算業(yè)務(wù)也看到了新的增長動力。
2023年百度核心收入1034.65億元,歸屬百度核心的凈利潤274億元,同比增長38%;大模型正在給百度帶來越來越多的商業(yè)收入,四季度內(nèi),僅大模型帶來的收入增長就達(dá)到了6.6億元,百度智能云的營收也來到了84億元;根據(jù)摩根士丹利的預(yù)估,2024年百度的廣告收入有望實現(xiàn)7%的同比增長。
雖然對字節(jié)來說,這點增長遠(yuǎn)遠(yuǎn)納入不了自己的眼睛,但不少業(yè)務(wù)線也依然具有一定的借鑒和參考價值。
據(jù)光錐智能了解到,受大模型浪潮影響,字節(jié)的云計算業(yè)務(wù)火山引擎的營收增長也比較可觀。得益于字節(jié)前期儲備了大量英偉達(dá)的GPU,很多大模型創(chuàng)業(yè)公司都愿意主動加入到火山引擎的生態(tài)中,從而拉動了火山引擎的增長。
雖然第一波先靠賣算力賺到第一桶金,但對火山引擎來說,未來靠使用這些大模型公司的算法而再次為云計算業(yè)務(wù)付費的客戶,才是更吸引人的。
而對字節(jié)賴以生存的廣告業(yè)務(wù)而言,大模型的影響力還尚未施展。目前,已經(jīng)有百度、網(wǎng)易有道在內(nèi)的幾家公司都提到,大模型對其廣告轉(zhuǎn)化都有促進(jìn)作用。這對抖音、今日頭條等業(yè)務(wù),無疑也是一個好消息。
為了提升營銷效率,抖音旗下的營銷平臺巨量引擎,也在1月23日,發(fā)布自動化技術(shù)品牌 UBMax(優(yōu)必投),立足應(yīng)用下載、線索留資、電商引流三個場景。
另外,火山引擎也推出了非常具有字節(jié)特色的產(chǎn)品——火山引擎智能創(chuàng)作云,這是一個批量生成視頻的智能SaaS平臺,主要幫助電商賣家批量生成商品素材。雖然目前市場上做此類產(chǎn)品的公司非常多,也有一些是抖音的深度合作伙伴,但對于同時擁有技術(shù)和場景的公司,也只能是字節(jié)才能做到。
綜上所述,總體來看,字節(jié)在AI的投入上還是趨于保守,更注重對實際業(yè)務(wù)能產(chǎn)生價值的產(chǎn)品,而對前沿技術(shù)的投入才剛剛起步。
這也和字節(jié)近一年的聚焦戰(zhàn)略有關(guān),近一年,字節(jié)幾乎清退或削減了所有與核心業(yè)務(wù)無關(guān)的業(yè)務(wù)條線,比如Pico、游戲。
核心業(yè)務(wù)強(qiáng)勢的時候,發(fā)展可以掩蓋一切問題。字節(jié)季度營收依然可以保持40%以上的同比增長,已經(jīng)羨煞其他所有國內(nèi)公司,但對字節(jié)和張一鳴來說,夢想還是要有的。