文|正見TrueView koorvoa
編輯|TV
“十倍于移動互聯(lián)網(wǎng)的平臺革命”,不僅吸引著國內(nèi)眾多科技大廠投身AI新浪潮,或自研通用大模型,或推出相關(guān)產(chǎn)品和解決方案,向企業(yè)服務(wù)、金融、工業(yè)等行業(yè)加速滲透,同時也引發(fā)細(xì)分領(lǐng)域的諸多垂直廠商積極占位,深耕領(lǐng)域內(nèi)的“一畝三分地”。
某種程度上而言,大模型是垂直廠商們“不得不為之”的“跟風(fēng)”選擇,即便在資金、技術(shù)、人才等硬件條件上與科技大廠相比不具優(yōu)勢,但面對新興技術(shù)浪潮的沖擊,不進則退,且極容易被新進入者顛覆。
這個新進入者,既包括新興的大模型創(chuàng)業(yè)公司,也指向“借機”扎根產(chǎn)業(yè)深處的科技巨頭。
01 以小博大,在夾縫中找機會
繼百度、阿里、華為等第一梯度玩家陸續(xù)發(fā)布大模型相關(guān)產(chǎn)品、方案,騰訊云也于近日正式公布行業(yè)大模型技術(shù)方案,加之今日發(fā)布大模型服務(wù)平臺“火山方舟”的火山引擎,國內(nèi)“頭號玩家”們的大模型技術(shù)方案和商業(yè)路徑終于全部“浮”于臺面之上。
“基本可以判斷,所有行業(yè)都值得用大模型重做一遍。當(dāng)然重做的方式可能有很大的差異,有些行業(yè)只需要用通用大模型做finetune或者對齊,但有些行業(yè)可能需要從頭開始訓(xùn)練,有些行業(yè)甚至連模型結(jié)構(gòu)都要換掉?!焙聊┲切袛?shù)據(jù)智能科學(xué)家賀翔對大模型的商業(yè)前景判斷,與當(dāng)前市場上的主流聲音一致,認(rèn)為大模型正成為人工智能浪潮的重要拐點。
盡管大模型是片藍(lán)海,蘊藏著“萬億級商業(yè)價值”,但“百模大戰(zhàn)”、“千模競帆”并非戲言,產(chǎn)業(yè)側(cè)則是更具確定性的商業(yè)標(biāo)的,競爭激烈程度不言而喻。
百度、阿里、騰訊等具有技術(shù)積累、團隊優(yōu)勢和資金支持的科技大廠率先搶跑,并加速應(yīng)用落地,開啟新一輪行業(yè)客戶之爭。
百度曾宣稱與超過300家企業(yè)成為生態(tài)伙伴;4月阿里云也宣布與七家企業(yè)推動大模型在油氣、電力、交通等行業(yè)落地;華為早前就已發(fā)布盤古金融、電力、藥物分子三個垂直領(lǐng)域大模型;而剛剛公布MaaS解決方案的騰訊已和數(shù)十個行業(yè)的22家企業(yè)達(dá)成大模型共建合作;火山引擎則透露抖音集團內(nèi)部已有十多個業(yè)務(wù)團隊試用“火山方舟”,首批邀測企業(yè)包括金融、汽車、消費等眾多行業(yè)客戶。
而剛剛發(fā)布私域大模型的傳統(tǒng)ICT廠商新華三、將于7月發(fā)布大模型的京東等等,都關(guān)注大模型與產(chǎn)業(yè)融合,直接瞄準(zhǔn)垂直賽道。
大廠綜合實力更強,一旦模型與場景“飛輪”轉(zhuǎn)起來,更快的掌握優(yōu)質(zhì)數(shù)據(jù)并搭建起服務(wù)生態(tài),垂直行業(yè)廠商們想再要追趕只會難上加難。
但并非沒有一搏的資本。綜合了專家經(jīng)驗、組織能力、工程能力的產(chǎn)業(yè)knowhow,是業(yè)界普遍認(rèn)為垂直行業(yè)廠商構(gòu)建大模型的資源壁壘與護城河。長期根植于一線客戶,深入的需求理解和豐富的落地場景優(yōu)勢,也是垂直行業(yè)廠商可貴的“籌碼”。
02 押注專業(yè)化,行業(yè)數(shù)據(jù)大比拼
“大模型這個賽道還是太早期了,如果說GPT-4和Bard、LLaMA、Claude(編者注:分別是谷歌、Meta、OpenAI前員工創(chuàng)立的Anthropic發(fā)布的大模型)等國外不同技術(shù)棧的大模型還存在比拼的話,那么國內(nèi)的大模型還沒有進入賽場(過于早期,沒有商用,無法比較),所以目前不存在國內(nèi)通用大模型之間的比拼。而在作為基石的國內(nèi)通用大模型還沒有真正進入賽場的情況下,垂直大模型也不存在太多的可比性,一切都還在早期?!被锇樵贫麻L兼 CEO戴志康對正見TrueView表示。
他進一步舉例補充,“某個用于Text2SQL(編者注:將自然語言文本Text轉(zhuǎn)換成結(jié)構(gòu)化查詢語言SQL的過程)的垂直模型,可能還比不上LLaMA通用開源模型的Text2SQL能力?!?/p>
目前大模型開展雖轟烈,卻還處于初級階段。百度、阿里等較早公布大模型技術(shù)路徑和架構(gòu)全景的頭部公司,產(chǎn)品也均未進入公測,屬于垂直行業(yè)廠商的時間窗口尚未關(guān)閉。
“垂類行業(yè)只要緊跟潮流,精準(zhǔn)解決用戶需求,不會脫離AI大模型?!蹦彻蓹?quán)投資機構(gòu)副總裁史松坡向正見TrueView分析了垂直行業(yè)廠商在大模型時代的機會點,“大模型的落地和應(yīng)用離不開掌握著流量和用戶的垂類廠商,它們需要解決的是如何緊跟大模型,并利用相關(guān)技術(shù)解決尚未滿足的行業(yè)客戶需求?!?/p>
加快大模型項目共創(chuàng),由單點測試擴散至規(guī)?;逃茫e累垂直領(lǐng)域數(shù)據(jù)和業(yè)務(wù)know-how,進而優(yōu)化大模型訓(xùn)練和調(diào)優(yōu)能力,挖掘和解決行業(yè)客戶尚未被顧及,或被充分改造的痛點,將數(shù)字化延伸至產(chǎn)業(yè)的“神經(jīng)末梢”處,這也許是當(dāng)前窗口期內(nèi)垂直行業(yè)廠商們的機會所在。
當(dāng)前越是傳統(tǒng)的行業(yè),對大模型產(chǎn)品和解決方案越是有針對性、專業(yè)性和精準(zhǔn)度的高要求。專業(yè)的訓(xùn)練數(shù)據(jù)和行業(yè)知識庫是領(lǐng)域大模型的難點,也是垂直行業(yè)廠商的優(yōu)勢。
“假定大家訓(xùn)練和調(diào)優(yōu)能力都差不多,那么誰有最大量、最高質(zhì)量的垂直領(lǐng)域數(shù)據(jù)集,誰就擁有了產(chǎn)出更優(yōu)質(zhì)垂直模型的能力。即便現(xiàn)在訓(xùn)練和調(diào)優(yōu)能力稍弱,但長期來講技術(shù)能力是能夠被追平的,而數(shù)據(jù)集的鴻溝則不一定能被追平。”在戴志康看來,“真正影響垂直廠商的差距點只有一個,即用于訓(xùn)練垂直模型的數(shù)據(jù)集。”
賀翔同樣認(rèn)為垂直與通用大模型“隔行如隔山”。“在純語言相關(guān)的垂直領(lǐng)域,可能存在垂直大模型與通用大模型的競爭。但是在自動駕駛這種獨特的垂直領(lǐng)域,不管是語料、任務(wù)、還是測評標(biāo)準(zhǔn),都與通用大模型完全不一致,只能夠用自動駕駛大模型來解決?!?/p>
03 新的馬拉松賽跑,在嘗試中找出路
目前大模型技術(shù)和產(chǎn)品密集發(fā)布,卻尚未有成熟案例和成功路徑借鑒,垂直廠商們只能摸著石頭過河,是MaaS(Model-as-a-Service,模型即服務(wù)),還是“完全沒有必要去卷大模型,而是應(yīng)該投身到應(yīng)用層創(chuàng)新”,標(biāo)準(zhǔn)答案尚未生成。
火山引擎總裁譚待判斷,“企業(yè)使用大模型,未來可能會呈現(xiàn)“1+N”的模式:“1”是通過自研或深度合作,形成1個主力模型;由于成本和場景復(fù)雜多元等原因,在這個主力模型之外,還會有N個模型同時應(yīng)用。”
“企業(yè)所需的并非僅僅是一個大模型,而是多個大模型。”竹間智能創(chuàng)始人兼CEO簡仁賢持相同觀點,“坦率來說,目前絕大多數(shù)的生成式AI都是基于谷歌開發(fā)的Transformer開發(fā)出來的模型”,他認(rèn)為大模型是不是自研已經(jīng)不重要了,“真正重要的是,最后用大模型驅(qū)動做出的產(chǎn)品是否有實際應(yīng)用價值?!敝耖g智能提供的是MaaS服務(wù)模式,并設(shè)定目標(biāo)要讓企業(yè)在99萬的預(yù)算內(nèi)即可打造一個企業(yè)自有的大模型。
“中國不太注重生態(tài),一般都是把別人全‘滅’了、全‘殺’了,其實自己也沒有發(fā)展起來。”自研大模型的Pre-A+輪企業(yè)瀾舟科技創(chuàng)始人兼CEO周明號召行業(yè)廠商應(yīng)該有一種平和的心態(tài),“To B存在很多新的創(chuàng)業(yè)機會,包括對客戶、行業(yè)的理解,客戶與大模型團隊的互動,形成某種意義上的戰(zhàn)略合作伙伴,或者形成所謂數(shù)據(jù)飛輪、功能飛輪,做得越深,相應(yīng)的壁壘就越高。任何一個公司進入到該領(lǐng)域,包括巨頭公司,都要花同樣的功夫進行積累。”
雖路徑不一,垂直行業(yè)廠商卻目標(biāo)一致。皆是用好大模型這一新的生產(chǎn)力工具,升級原有的生產(chǎn)方式,建立新的生產(chǎn)關(guān)系。而這也將是垂直廠商和在互聯(lián)網(wǎng)及兩次AI浪潮期間崛起的明星企業(yè)間,一場新的馬拉松賽跑。
“垂直模型的底座仍然是通用模型,最終決定市場格局的,是底座通用模型的能力和上層垂直模型的優(yōu)化。而現(xiàn)在通用模型的發(fā)展日新月異,所以垂直模型也面臨剛發(fā)布不久就需要升級底座的情況。”戴志康解釋說,“基于ChatGLM-6B研發(fā)的垂直模型,即便當(dāng)下效果不錯,但當(dāng)三個月后ChatGLM-6B被xxx-6B超越,垂直模型也面臨重新洗牌的局面?!彼毖裕叭绻J(rèn)為現(xiàn)在憑借垂直模型就能構(gòu)成拐點,可能只是一種市場營銷手段?!?/p>
在長期競爭中,沒有穩(wěn)固不變和一蹴而就的市場格局。這場新的馬拉松賽跑,匆忙開局,終點未知。