文|連線Insight 王慧瑩
編輯|子夜
OpenAI再次引發(fā)全球注目。
北京時間2月16日,OpenAI發(fā)布了文生視頻大模型Sora。從官方介紹看,Sora能夠根據(jù)文本提示創(chuàng)建詳細的視頻,擴展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場景,最長能生成60秒視頻。
這熟悉的一幕,讓人夢回2023年。彼時,ChatGPT引發(fā)了大模型的浪潮,掀起了全球范圍內的AI軍備競賽。到了今年,OpenAI再次扔出一枚石子,在文生視頻的池子里激起漣漪。
Sora讓“一句話生成視頻”變成可能,這是一場人工智能改變視頻制作的革命,全球短視頻巨頭字節(jié)跳動也不能忽視這個浪潮。
巧合的是,Sora問世一周前,字節(jié)跳動宣布了一項人事變動,原抖音集團CEO張楠宣布,自己已經(jīng)辭去集團CEO一職,未來把精力聚焦在剪映的發(fā)展上。字節(jié)跳動CEO梁汝波表示,感謝張楠過去帶領中國信息平臺業(yè)務做出的貢獻和突破,期待她在新崗位上再接再厲。
作為元老級員工,張楠已經(jīng)加入字節(jié)跳動十年整,主導推出了抖音、火山等產(chǎn)品。她帶領抖音完成了對競爭對手的反超,成為字節(jié)跳動實現(xiàn)二次飛躍的關鍵人物。如今,抖音的日活已經(jīng)超過6.5億,成為全球范圍內短視頻領域的佼佼者。
高層的變動常常伴隨業(yè)務的調整,讓最熟悉抖音生態(tài)的人來負責剪映,字節(jié)跳動的目標很明確,要在AI文生視頻制作方面抓住新的爆發(fā)機遇。
據(jù)時代周報報道,接近剪映的人士透露,過去一年,張楠已經(jīng)把絕大多數(shù)精力傾斜到剪映先關的業(yè)務上,并親自帶隊尋求在AI輔助創(chuàng)作上有所突破,并即將推出一個AI生成和視頻的產(chǎn)品。
ChatGPT和Sora給字節(jié)跳動帶來了新的啟發(fā),也帶來了更多壓力。過去一年,字節(jié)跳動延續(xù)超級APP的邏輯,接連推出了多款基于AI技術的產(chǎn)品,分布對話、工具、互動劇情等多個類別,包括豆包、扣子等APP。
動作很多,但速度不快,成果不顯,這讓字節(jié)跳動感到焦慮。年初內部會議上,梁汝波把對技術部門的不滿表達得很直白。他說,字節(jié)跳動居然直到2023年才開始討論GPT,而業(yè)內做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的。
AI風口下,字節(jié)還沒能大力出奇跡,張楠再次擔任了沖鋒者的角色。能否帶領剪映再次創(chuàng)造奇跡,對張楠和字節(jié)跳動來說至關重要,這決定了字節(jié)跳動能否走出增長困境,尋找到新的生機。
1、Sora來了,壓力給到了字節(jié)跳動
一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包;她戴著太陽鏡,涂著紅色口紅;她走路自信又隨意……
潮濕積水的街道倒映著上空的影像、女性皮膚上的毛孔清晰可見,如此逼真寫實的視頻畫面,出自AI之手。
Sora示例視頻,來源OpenAI官網(wǎng)
沒有任何預告,OpenAI再放大招。北京時間2月16日OpenAI在社交平臺X發(fā)帖,首次對外公布了名為Sora的文生視頻AI模型。
Sora帶來的震撼,不亞于去年的ChatGPT,瞬時成為開年最火爆的話題之一。
事實上,文生視頻并非新鮮事物。在Sora發(fā)布前,根據(jù)知名投資機構a16z統(tǒng)計,截至2024年底,市場上共有21個公開的AI視頻模型,包括大眾熟知的Runway、Pika、Genmo以及Stable Video Diffusion等等。
但Sora為何會如此驚艷,并以顛覆性再次攪動AI行業(yè)?理解力、還原力是Sora效果超預期的核心。
OpenAI官網(wǎng)上的多段視頻也證明了Sora的能力。兩艘海盜船在一杯咖啡中航行,在泛白的咖啡泡沫中互相激斗;載滿乘客的列車駛過光影交替的城市,車窗上投射出生動的車內倒影;舞龍隊伍在周邊人群的圍觀和隨行中前進,遠近透視真實感十足。
在視頻時長上看,用戶只需要輸入一段文本,Sora就能自動生成最長一分鐘的高清視頻。這超出了市面上的大多數(shù)產(chǎn)品。根據(jù)a16z統(tǒng)計,現(xiàn)有的AI視頻模型制作的視頻長度大都在10秒以內,像此前大熱的Runway Gen 2、Pika,其制作的視頻長度分別只有4秒和3秒。
更重要的是,Sora對真實世界的理解能力和還原能力都超出了市面現(xiàn)有的大模型。
正如OpenAI在官方博客上寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實世界如何存在。具體而言,Sora不僅能實現(xiàn)一鏡到底,還能完成多角度鏡頭、分鏡頭的切換,更能還原真實世界中的光影反射、人類行為等。
超預期的表現(xiàn)離不開技術支撐。據(jù)OpenAI介紹,因使用Transformer架構,Sora具有極強的擴展性,同時在基于過去對DALL·E和GPT的研究基礎構建上還利用了DALL·E 3的重述提示詞技術,為視覺模型訓練數(shù)據(jù)生成高描述性的標注。
Sora的出現(xiàn)能否掀起中國乃至全球范圍新一輪的AI軍備競賽尚不可知,但能生成60s視頻的Sora,把壓力實實在在給到了字節(jié)跳動。因為60s視頻所處的賽道,正是字節(jié)跳動王牌業(yè)務抖音的大本營。
在抖音生態(tài)越來越豐富后,為了服務內容創(chuàng)作者,剪映也應運而生。背靠抖音的流量池,截至2021年,剪映的月活用戶已經(jīng)突破1億,是國內最大的移動視頻編輯產(chǎn)品。而TikTok在全球的風靡,也帶動了剪映海外版CapCut的下載量激增。
剪映之所以能夠如此風靡,原因在于降低了門檻,讓普通人都能夠更快更簡單地產(chǎn)出視頻內容。
而近兩年,隨著AIGC的火爆,視頻制作門檻將被再次降低。這也是如今Sora對剪映產(chǎn)生威脅的核心原因:更多人將傾向于選擇門檻更低,但效果更好的平臺,剪映的用戶將可能被AI視頻生成產(chǎn)品搶走。
為了留住用戶,同時也為了抓住新的機會,剪映布局AIGC幾乎是必然。
2023年11月,剪映測試名為“Dreamina”的AIGC工具,用戶只需輸入一段文字,Dreamina即可生成四幅由AI生成的創(chuàng)意圖像。這些圖像可以從抽象、寫實等多個維度生成,滿足不同用戶的審美需求。
彼時,據(jù)Tech星球報道,消息人士透露,該工具未來會用于抖音的圖文或短視頻的內容創(chuàng)作,豐富抖音在AI創(chuàng)造方面的內容庫。
不過從效果來看,目前剪映面臨和Runway、Pika、Genmo等產(chǎn)品一樣的困境:視頻的運動不自然,保真度不高、視角單一等問題,這些問題本質上是技術問題,Sora靠技術解決了這些問題,威脅到“剪映們”生存的同時,也給“剪映們”提供了思路。
今年,原抖音集團CEO張楠卸任,轉而投入剪映的發(fā)展,透露出抖音乃至字節(jié)對AI創(chuàng)作的重視。值得關注的是,在張楠發(fā)給剪映的內部信中,張楠提到,AI圖像生成技術正在內容創(chuàng)作工具行業(yè)帶來巨大的變化和可能性。
如今,Sora的橫空出世,給了字節(jié)跳動壓力,它不能再慢了,而如何帶剪映突圍,則成了張楠新階段的重任。
2、張楠要為字節(jié)跳動再次“開疆”
加入公司十年,原抖音集團CEO張楠算得上是字節(jié)跳動的功臣。某種程度上看,字節(jié)跳動短視頻業(yè)務能夠快速“開疆擴土”,靠的就是張楠。
2015年開始,張楠先是帶著團隊推出了火山小視頻,上線后迅速爆火,日活躍用戶很快突破5000萬;2016年,張楠從0到1推出了抖音,為當下國內最火的短視頻APP奠定了基礎,如今抖音的日活超過了6.5億。
2020年3月12日,字節(jié)跳動在成立八周年之際,宣布張楠擔任字節(jié)跳動(中國)CEO,作為中國業(yè)務總負責人,全面協(xié)調公司中國業(yè)務的產(chǎn)品、運營、市場和內容合作,包括今日頭條、抖音、西瓜視頻、搜索等業(yè)務和產(chǎn)品。
張楠,圖源字節(jié)跳動官網(wǎng)
沒過多久,伴隨字節(jié)組織架構調整,抖音從字節(jié)跳動旗下的APP成長為擁有復雜生態(tài)的抖音集團,旗下?lián)碛卸兑?、火山、剪映、輕顏相機等多個APP,張楠出任抖音集團CEO。
身份的變化,讓張楠更像是幕后掌控抖音全局的指揮官,而非沖鋒陷陣的將軍,但她始終是最了解抖音生態(tài)的人。
伴隨市場環(huán)境的變化,抖音短視頻的增長不及以前是事實,但抖音要為字節(jié)尋找新增量的目標沒變。AI的東風越吹越大,原本是抖音視頻創(chuàng)作工具的剪映站在風口之上,這是個機會,字節(jié)跳動必須抓住。
這時候,張楠的位置和角色很重要,最了解抖音的人,現(xiàn)在轉去負責剪映。
離開自己一手帶出來的抖音,張楠在告別文中表示,“在未來的十年再折騰一些我熱愛的事情”。
張楠職位的變化,與其說是她離開抖音權力中心,不如說是被放在了新的關鍵位置上,也釋放出字節(jié)要在AI領域突圍的信號。
就在張楠辭任抖音CEO一周前,字節(jié)CEO梁汝波在字節(jié)舉行的2024年度全員會上發(fā)表了“始終創(chuàng)業(yè),逃逸平庸的重力”的內部講話。
在這場分享會上,梁汝波多次提及“危機感”一詞,梁汝波甚至還將“加強危機感”列入年度目標。他坦言,最大的危機感,是擔心字節(jié)作為一個組織,正在變得平庸,無法取得新的突破。
字節(jié)跳動CEO梁汝波,圖源字節(jié)范兒微信公眾號
當短視頻業(yè)務趨近天花板,字節(jié)需要找到新的增長點。當OpenAI的兩枚炸彈證明了AI行業(yè)蘊藏的想象力,字節(jié)跳動作為一家擁有豐富內容生態(tài)的公司,擁有天然的AI使用場景,必須跟上AI的腳步,用AI技術為自身尋找突破。
“字節(jié)跳動是最好的平臺,既有夢想,又務實的浪漫,我很期待和剪映的小伙伴們一起造夢,與這個AI的時代一起成長,共同繪制出腦海中的奇幻世界。”張楠如此寫道。
這個AI夢,不只屬于張楠自己,更肩負著字節(jié)跳動的希望。
3、AI時代,字節(jié)跳動的全球挑戰(zhàn)
如果一家創(chuàng)業(yè)公司2023年上半年營收超越騰訊,2024年開年估值達到2250億美元,位于全球獨角獸榜首,那這家公司的年度關鍵詞會是什么?
不是信心、不是振奮,字節(jié)跳動CEO梁汝波給出的答案是危機感。
梁汝波提到,組織上,字節(jié)跳動變得平庸:低效、遲鈍、標準低;人才管理上,去肥增瘦效果不明顯,對優(yōu)質人才吸引力降低;業(yè)務上,核心業(yè)務領先不明顯,其他業(yè)務需要突破。
“對機會敏感度不如創(chuàng)業(yè)公司”,公司業(yè)務上遲鈍加重了梁汝波的危機感。對大模型的技術浪潮跟進太慢,就是梁汝波感到危機的原因之一。
2023年,由OpenAI開啟了“ChatGPT熱”,也掀起了全球范圍內的GPT競賽,國內外多個知名互聯(lián)網(wǎng)巨頭都推出了自研大模型產(chǎn)品。
回看字節(jié)跳動的動作:2023年1月組建了首個大模型團隊,將遠在新加坡負責TikTok技術負責人朱文佳調回國內擔任團隊的業(yè)務負責人;2023年5月,字節(jié)跳動創(chuàng)始人張一鳴忙著研究OpenAI的一系列論文,并且常常讀至深夜。
只是,相比字節(jié)跳動曾經(jīng)的戰(zhàn)斗力,在新的AI時代,字節(jié)跳動似乎沒能一鳴驚人。
當其他公司都在加入大模型競賽,一個接著一個產(chǎn)品陸續(xù)推出后,字節(jié)跳動在2023年8月才推出自研大模型“云雀大模型”。在此之后,字節(jié)跳動的AI動作才變得快速而頻繁起來。
先是AI對話產(chǎn)品“豆包”開啟測試,它的前身是字節(jié)內部代號為“Grace”的AI項目,可以生成歌詞、小說、文案等文本內容,還可以提供數(shù)學計算、翻譯、英文寫作等功能;后有扣子、AI角色互動APP“話爐”、AI產(chǎn)品“PicPic”等產(chǎn)品進入內測和研發(fā)階段。
目前,字節(jié)在國內外已上線十余款AI產(chǎn)品,除了上述提到的產(chǎn)品,還有“AI搜”、 AI情緒伴聊機器人的“抖音小晴”、 針對電商內容創(chuàng)作的產(chǎn)品“即創(chuàng)”、AI工具合集小悟空(ChitChop)、 AI 劇情互動平臺BagelBell等。
這些產(chǎn)品的背后,是一個全新的AI部門Flow,也是字節(jié)在AI時代的排頭兵。據(jù)36氪報道,F(xiàn)low部門技術負責人為字節(jié)跳動技術副總裁洪定坤。一位知情人士告訴36氪,這一新部門的業(yè)務帶頭人,為字節(jié)大模型團隊的負責人朱文佳;據(jù)Tech星球報道,字節(jié)跳動產(chǎn)品與戰(zhàn)略副總裁朱駿已負責Flow部門的產(chǎn)品線。
調用多名主力干將,字節(jié)發(fā)力AI的意圖已經(jīng)十分明顯。只是,雖然在AI的投入不少,但字節(jié)系產(chǎn)品要突圍并不容易。比如,“豆包”的推出不僅比ChatGPT晚了八個月,從效果上看,多家媒體評測結果顯示,“豆包”的智能化水平在大模型C端助理類產(chǎn)品中沒有明顯優(yōu)勢。
一個明顯的變化是,到了AI時代,字節(jié)跳動還處在追隨者的角色,且尚未有彎道超車的跡象。
而放眼TikTok在全球的發(fā)展,要面對的挑戰(zhàn)和競爭也不少。在這種情況下,字節(jié)跳動在AI時代還沒有自己的獨特優(yōu)勢,甚至有可能被新技術顛覆,這或許正是梁汝波的危機感所在。
“字節(jié)跳動目前的業(yè)務有非常大的慣性,哪怕團隊不額外努力,公司仍然可以依賴慣性滑行很長一段時間,但這是很危險的?!?梁汝波提到。
在過去的十年,字節(jié)跳動抓住了短視頻時代的紅利,而下一個十年,如何在AI時代,從追隨者變成創(chuàng)造者,保持創(chuàng)業(yè)狀態(tài)繼續(xù)突圍,考驗著字節(jié)跳動。