文|劉曠
一直以來,追逐風(fēng)口都是互聯(lián)網(wǎng)企業(yè)的天性。因此,繼元宇宙風(fēng)口之后,橫空出世并火遍全國的AIGC和ChatGPT,便又成為了各行業(yè)企業(yè)追逐的焦點。在此背景下,無論是國內(nèi)互聯(lián)網(wǎng)大廠,還是科技公司,亦或是內(nèi)容平臺,但凡有些實力的玩家都紛紛下場,圍繞AI大模型展開了一場激烈角逐,“千模大戰(zhàn)”也就此拉開了帷幕。
一場基于大模型的創(chuàng)業(yè)浪潮開始席卷開來,國內(nèi)陸續(xù)布局大模型的企業(yè)也如雨后春筍般爭相涌現(xiàn)。只不過,與百度、阿里、華為這類打造通用大模型的“高端”玩家不同,知乎、小紅書、快手等則選擇了另辟蹊徑。而作為內(nèi)容問答、短圖文、短視頻等主流內(nèi)容形式的代表,知乎、小紅書、快手這些小巨頭們對大模型的探索,自然也就成為了外界關(guān)注的重點。
競逐大模型
大模型無疑是今年最熱的風(fēng)口,國內(nèi)企業(yè)早就陸續(xù)宣布對大模型展開探索,而不管是投資還是自建,已經(jīng)開始進(jìn)場分羹的不在少數(shù),知乎、小紅書、快手自然也不會錯過這班“列車”。眾所周知,互聯(lián)網(wǎng)大廠對大模型展開研發(fā)及相關(guān)布局,是高度符合其產(chǎn)業(yè)互聯(lián)網(wǎng)戰(zhàn)略的,而相比之下,知乎、小紅書、快手這三個平臺的進(jìn)場,雖是意料之外,卻也依舊在情理之中。
一方面,AI技術(shù)逐漸普及,玩家們充分受益于人工智能技術(shù)浪潮,自然不想錯過這個時代的變革。AI技術(shù)的發(fā)展將會帶來產(chǎn)業(yè)的進(jìn)步和新機(jī)遇的誕生,而伴隨著人工智能技術(shù)不斷取得突破,AI大模型也呈現(xiàn)蓬勃發(fā)展態(tài)勢。AI大模型浪潮席卷全球,只有先上牌桌,才能抓住規(guī)則這張“王牌”,因此,知乎、小紅書、快手等玩家進(jìn)軍大模型就變得刻不容緩了。
另外,對于這些玩家來說,一旦別家的大模型落地,或會對其構(gòu)成一定的威脅,而為了防范風(fēng)險,入局就變得順理成章了。進(jìn)入AIGC時代,基于深度學(xué)習(xí)的大模型將極大提升內(nèi)容生產(chǎn)的速度和數(shù)量。在此背景下,擁有了“技術(shù)優(yōu)勢”的競爭對手很可能會迅速突破知乎、小紅書、快手的護(hù)城河,因此,布局大模型就變成了這些小巨頭們保持競爭力的一種方式。
另一方面,在移動互聯(lián)網(wǎng)紅利消退的背景下,選擇擁抱大模型,可以讓這些玩家的內(nèi)容變得更加多元化,有望帶來新的增長點。由決策式AI到生成式AI的演變正在將大模型應(yīng)用推向更加多元化的場景,知乎、小紅書、快手等平臺推出大模型產(chǎn)品,則可以提高內(nèi)容生產(chǎn)的速度和質(zhì)量,以拓展更多新內(nèi)容;還可以更好地滿足用戶的需求,從而吸引更多用戶留存。
另外,這些玩家都或多或少地面臨著商業(yè)化困境,而利用大模型,有望助其更好地實現(xiàn)商業(yè)化。一直以來,小紅書都困于“站內(nèi)種草,站外拔草”,商業(yè)化閉環(huán)難構(gòu)建;知乎和快手也分別因為難抵廣告收入下滑和營業(yè)成本高昂,以及深陷直播電商競爭,而常年處于虧損之中。而其對AI大模型的訓(xùn)練,能給內(nèi)容社區(qū)帶來一波紅利,從而反哺業(yè)務(wù)增長以及商業(yè)化加速。
從以上角度來看,布局大模型,似乎已經(jīng)成為了知乎、小紅書、快手等小眾玩家不得不打的一場仗。只不過,由于每家的商業(yè)邏輯和入場角度不同,每家在大模型上的優(yōu)勢和表現(xiàn)也是不盡相同。而憑借著自身在AI技術(shù)和內(nèi)容上的積累,這些平臺們也開始在大模型領(lǐng)域各顯神通。
知乎快人一步
作為國內(nèi)領(lǐng)先的問答社區(qū)及原創(chuàng)內(nèi)容平臺,知乎早就將大模型能力應(yīng)用到了平臺中。據(jù)悉,4月,知乎發(fā)布了大語言模型“知海圖AI”,并內(nèi)測首個站內(nèi)大模型應(yīng)用功能“熱榜摘要”;隨后,又發(fā)布了一款大模型智能應(yīng)用功能“搜索聚合”。得益于此,知乎已經(jīng)成為國內(nèi)首批具備大語言模型能力的公司,而知乎之所以能加入生成式AI的戰(zhàn)局,自然是具備了一些特色和優(yōu)勢。
一是,知乎大規(guī)模、高質(zhì)量的中文數(shù)據(jù)池是訓(xùn)練大模型的良好素材,將大幅度提升訓(xùn)練效率。知乎PUGC的運營模式為其積累了海量、優(yōu)質(zhì)的數(shù)據(jù)。據(jù)悉,截至2022年第四季度,知乎社區(qū)上累計內(nèi)容達(dá)6.5億條,其中包括5.1億條問答,就連微軟NewBing都將其視作中文數(shù)據(jù)源之一??梢?,知乎對于訓(xùn)練大模型類的AI來說,無疑是一個非常優(yōu)秀的數(shù)據(jù)庫資源。更何況,這些數(shù)據(jù)從形式上就十分契合大模型輸入、輸出的訓(xùn)練方式,能有效提升訓(xùn)練效率。
二是,知乎基于問答的討論場是大模型天然的應(yīng)用場景,能夠快速精準(zhǔn)地為用戶提供大模型服務(wù)。眾所周知,知乎是國內(nèi)最有名的知識問答社區(qū),這些年知乎積累了海量的問答資源,而提供這一資源的用戶來自各行各業(yè),擁有不同的知識背景和經(jīng)驗,他們的答案通常會更為專業(yè)、詳細(xì)和科學(xué),可以有效確保內(nèi)容的準(zhǔn)確性和深度。而這也就意味著,知乎大模型可以從多個角度學(xué)習(xí)和理解問題,并對用戶進(jìn)行更精準(zhǔn)的推薦和問答。
三是,知乎與面壁智能的合作,能助其在訓(xùn)練人工智能模型時,獲得更專業(yè)、更先進(jìn)的技術(shù)支持。由于沒有大廠的雄厚實力,知乎這類中廠便開始通過聯(lián)合研發(fā)與戰(zhàn)略投資的方式,與國內(nèi)大模型團(tuán)隊共同開發(fā)中文大模型。知乎的合作伙伴——面壁智能是一家專注于大模型研發(fā)的企業(yè),其在自然語言處理和機(jī)器學(xué)習(xí)領(lǐng)域擁有深厚的技術(shù)積累。與面壁智能的合作,可以為知乎AI大模型的研發(fā)提供更加專業(yè)和及時的技術(shù)支持。
小紅書穩(wěn)步推進(jìn)
事實上,除知乎之外,小紅書已秘密籌備了“大模型”團(tuán)隊,搶先參與到大模型技術(shù)的研發(fā)布局中。有消息報道稱,小紅書在4月悄然上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫。
顯然,與大廠相比,小紅書的資金儲備和技術(shù)實力都不夠雄厚,而鑒于大模型研發(fā)需要高昂的算力、數(shù)據(jù)以及人力成本,小紅書參與大模型研發(fā)的概率并不高,更多地可能會聚焦大模型應(yīng)用環(huán)節(jié),圍繞平臺內(nèi)用戶運營,以及創(chuàng)作者工具提供等方向展開。盡管如此,小紅書布局大模型,依舊有著自己的底氣。
一來,小紅書多類型數(shù)據(jù)的內(nèi)容社區(qū),是大模型極佳的實踐場景。經(jīng)過多年積累,小紅書的社區(qū)內(nèi)容生態(tài)中的內(nèi)容量豐富且多樣,據(jù)悉,小紅書已經(jīng)成長為一個月活超2億的UGC內(nèi)容社區(qū),涵蓋了視頻、圖片、文字、筆記、用戶評論等多個類型的數(shù)據(jù)。而這些數(shù)據(jù)也將會為自然語言處理、AI輔助內(nèi)容的生成提供多模態(tài)的數(shù)據(jù)基礎(chǔ)和應(yīng)用場景。
二來,小紅書結(jié)構(gòu)化的筆記內(nèi)容,更方便大模型進(jìn)行套路的學(xué)習(xí)和輸出。根據(jù)小紅書在“WILL商業(yè)大會2023”上公布數(shù)據(jù)顯示,通過將筆記、用戶行為數(shù)據(jù)結(jié)構(gòu)化,小紅書識別了26萬的屬性詞、600萬+的昵稱詞、700萬+的情感描述詞。而小紅書可拆解、規(guī)律化的平臺屬性,更有利于大模型應(yīng)用的模仿,從而也能夠為平臺帶來生產(chǎn)效率的提升。
三來,小紅書千人千面的推薦系統(tǒng),有望成為大模型訓(xùn)練的樣本。基于大規(guī)模的用戶行為的產(chǎn)生,小紅書團(tuán)隊根據(jù)用戶的特點去做了更加個性化的搜索。小紅書中的瀑布流或者內(nèi)容流,就是系統(tǒng)根據(jù)用戶行為中的規(guī)律,找出了用戶感興趣的內(nèi)容并推薦給了用戶。而針對小紅書平臺產(chǎn)生的海量數(shù)據(jù)參數(shù),將有可能會被實時送到模型中去做預(yù)估,而且隨著樣本的不斷變化,模型參數(shù)也將會不斷更新。
快手躍躍欲試
知乎和小紅書一直在積極籌備,快手自然也不能落后。據(jù)程一笑介紹,快手目前已組建了大模型研發(fā)團(tuán)隊,并依托過去在AIGC算法和大規(guī)模語言模型方面的技術(shù)積累,按計劃推進(jìn)大模型開發(fā)和訓(xùn)練,只是當(dāng)前模型還處于訓(xùn)練階段??焓蛛m然暫時沒有對外發(fā)布大模型產(chǎn)品,但能看出其對大模型是持積極擁抱態(tài)度的。而在快手積極布局背后,自然也有著涉足大模型的驅(qū)動力。
一方面,快手的視頻生成是生成式AI相對缺乏的細(xì)分領(lǐng)域,有助于形成差異化優(yōu)勢。入局大模型賽道的玩家有很多,但相比較而言,作為國民級短視頻應(yīng)用的快手的探索方向就顯得十分與眾不同。據(jù)了解,快手目前在大模型方面的嘗試包括大規(guī)模語言模型、多模態(tài)預(yù)訓(xùn)練大模型、智能創(chuàng)作工具等。除了文本之外,快手還在語音、圖像、視頻、3D圖形等各個模態(tài)的內(nèi)容生成方面均有所嘗試。
另一方面,快手短視頻平臺具有娛樂化屬性,能給予大模型一定的試錯空間。據(jù)目前透露的消息來看,快手大模型目前主要由兩部分功能組成,一種是類似于Midjourney的文生圖功能,一種是類似于ChatGPT的對話式AI工具。而盡管快手稱“語言描述的精準(zhǔn)度不及Midjourney”,但相較于極度追求專業(yè)化的Midjourney,以UGC為主的快手本身對大模型的要求不會有太高。
作為各行業(yè)的代表企業(yè),知乎、小紅書、快手爭相擁抱大模型,固然有其必要性和優(yōu)勢條件,但AI大模型所伴隨的深重危機(jī)感也不容忽視。上面所提到各個內(nèi)容平臺的表現(xiàn),都只是其增加了一些有關(guān)大模型的“新功能”,其AI大模型產(chǎn)品距離成熟還有很遠(yuǎn),實現(xiàn)商業(yè)化落地,更是難上加難。
目前來看,國內(nèi)大中小廠扎堆大模型的現(xiàn)象已經(jīng)是屢見不鮮,對于參賽的玩家而言,大模型的能力雖是比拼的重點,但具體的場景和落地應(yīng)用同樣關(guān)鍵。而最終誰能在這場“大模型混戰(zhàn)”中存活下來,并拔得頭籌,也還需要時間來檢驗。不過,可以肯定的是,知乎、小紅書、快手想要從中突圍,還有很長的路要走。