文|科技新知 王思原
編輯|賽柯
這屆WAIC世界人工智能大會(huì)上,每家AI企業(yè)似乎都找了自己的PMF(產(chǎn)品市場(chǎng)契合點(diǎn))。
2023年是國(guó)產(chǎn)大模型元年,騰訊、字節(jié)、百度等眾多大模型進(jìn)入市場(chǎng),正式開(kāi)啟對(duì)外服務(wù),月之暗面、智譜AI等創(chuàng)業(yè)公司也形成“五小虎”的格局。迭代發(fā)展一年后,大模型選手們都已走向臺(tái)前,給了AI行業(yè)更多的機(jī)會(huì)和答案。
不同于去年大模型的“重在參與”,今年WAIC的重頭戲聚焦在更實(shí)際的應(yīng)用、更顛覆性的技術(shù)和更普惠的模型。簡(jiǎn)單來(lái)說(shuō),往年 WAIC 上廠商們是大模型性能展示和比拼,如今更聚焦的向行業(yè)展示實(shí)際的最新落地成果和應(yīng)用方向,比的是大模型落地能力。
從百度、阿里、騰訊,到商湯、智譜、百川、Minimax,從參數(shù)到技術(shù),從多模態(tài)到端云協(xié)同,從價(jià)格到應(yīng)用落地,各家在大模型的方向上似乎愈加清晰,也愈加務(wù)實(shí)。
而透過(guò)本次WAIC大會(huì),一個(gè)對(duì)于整個(gè)行業(yè)都較為清晰的信號(hào)則是,雖然技術(shù)依舊青澀,焦慮也依然存在,但一個(gè)個(gè)在產(chǎn)業(yè)側(cè)落地的AI應(yīng)用的確在真實(shí)地發(fā)生,只是聚光燈之外,這些AI加持下的產(chǎn)品應(yīng)用也沒(méi)想象中那么亮眼。
AI應(yīng)用“卷上”舞臺(tái)
如果說(shuō)去年的WAIC是企業(yè)的狂歡,那么今年的WAIC便是用戶的狂歡。
從遠(yuǎn)離用戶的模型層面來(lái)看,除了字節(jié)、月之暗面、零一萬(wàn)物等主要面對(duì)C端市場(chǎng)的企業(yè)缺席外,其余中國(guó)Tier 1與Tier 2的大模型團(tuán)隊(duì)幾乎全部到場(chǎng)展出,包括BAT、智譜AI、面壁智能、百川智能、階躍星辰等等;但除此之外,會(huì)內(nèi)會(huì)外也再無(wú)新增的中國(guó)大模型公司。而WAIC官方披露的的八大“鎮(zhèn)館之寶”中,模型層成果只占1/4。
而應(yīng)用層,阿里云、華為云、無(wú)問(wèn)芯穹、壁仞、遂原等中國(guó)企業(yè)不斷展出圍繞大模型訓(xùn)練與推理的新成果,AI模型在千行百業(yè)的應(yīng)用也呈現(xiàn)愈加井噴之勢(shì)。
例如阿里不光展示了智能編碼助手“通義靈碼”,更是通過(guò)“通義十二時(shí)辰——體驗(yàn)AI助手陪伴的一天”,全方位通義千問(wèn)大模型背后的對(duì)話、效率、智能體、視覺(jué)四大核心能力,讓用戶感知AI助手在生活、學(xué)習(xí)和工作中的實(shí)際作用。此外,釘釘和支付寶在辦公以及生活助手場(chǎng)景下,也是阿里AI能力落地上的重要一面。
騰訊的元寶APP覆蓋工作提效、生活?yuàn)蕵?lè)兩大場(chǎng)景,除了提供AI搜索、AI總結(jié)、AI寫作等核心功能,還提供創(chuàng)意繪畫、口語(yǔ)陪練、百變AI頭像等有趣好玩的特色應(yīng)用,以及更多用戶創(chuàng)建的智能體。
商湯展示了可控人物視頻生成大模型Vimi,Vimi基于商湯日日新大模型的強(qiáng)大能力,僅通過(guò)一張任意風(fēng)格的照片就能生成和目標(biāo)動(dòng)作一致的人物類視頻,并支持多種驅(qū)動(dòng)方式,可通過(guò)已有人物視頻、動(dòng)畫、聲音、文字等多種元素進(jìn)行驅(qū)動(dòng)。
類似提高效率的落地應(yīng)用還有許多,從金山辦公的WPS AI,到智譜AI的數(shù)字人直播平臺(tái),再到集體亮相的十八金剛?cè)诵螜C(jī)器人等等,涵蓋醫(yī)療、教育、辦公等各個(gè)場(chǎng)景,并且這些應(yīng)用不再是概念性的演示,而是已經(jīng)深入到了各行各業(yè)的核心業(yè)務(wù)流程之中,成為了提高效率、降低成本、創(chuàng)造價(jià)值的關(guān)鍵驅(qū)動(dòng)力。
從技術(shù)競(jìng)賽到應(yīng)用落地的全面進(jìn)化,無(wú)論是一線科技巨頭BAT(百度、阿里巴巴、騰訊),還是智譜AI、百川智能、階躍星辰、商湯等二線廠商,都將目光投向了AI的實(shí)際應(yīng)用與商業(yè)化成果,而非僅僅局限于模型性能的展示。但繁榮的同時(shí),同質(zhì)化問(wèn)題也逐漸顯露。
路線割裂,產(chǎn)品卻一致
一個(gè)事實(shí)是,AI應(yīng)用的落地要比預(yù)想的更快、更深,范圍更廣,只是從結(jié)果上來(lái)看,無(wú)論是發(fā)展邏輯、路線,以及用戶對(duì)產(chǎn)品的預(yù)期都有一定出入。
先說(shuō)各家商業(yè)模式上的路線,百度的CEO李彥宏這段時(shí)間,甚至在WAIC現(xiàn)場(chǎng)都還在反復(fù)強(qiáng)調(diào),商業(yè)化的閉源模型是最能打的;而隔壁的阿里云則是在力挺開(kāi)源,至于另一家騰訊,則喊著“通用大模型不是模型應(yīng)用的唯一方向”。
大廠都做不到路線統(tǒng)一,小廠更是五花八門。智譜AI走B端路線,用戶群體卻是C端;百川智能將企業(yè)應(yīng)用的MaaS化產(chǎn)品作為重點(diǎn)展品;MiniMax同時(shí)堅(jiān)持To B與To C業(yè)務(wù)并重的發(fā)展策略。
研發(fā)方向的不同,也意味著各家都有不同的顧慮。例如騰訊,騰訊在大模型上發(fā)布上算是慢了一步,但根據(jù)騰訊混元大模型負(fù)責(zé)人劉煜宏最新透露,騰訊內(nèi)部有接近700個(gè)業(yè)務(wù)接入混元,包括騰訊會(huì)議、文檔,微信讀書(shū)的AI助手等,這也使得過(guò)去半年騰訊在大模型上的新產(chǎn)品、新版本發(fā)布的頻率越來(lái)越高,這本質(zhì)是因?yàn)椴惶剿髟鶤I大模型應(yīng)用,不知道怎么跟業(yè)務(wù)更好合作。
不過(guò)過(guò)去一年無(wú)論大家走怎樣的路徑,一年后給到用戶的結(jié)果十分相似。最簡(jiǎn)單的就是,在這次大會(huì)之前,無(wú)數(shù)用戶可以說(shuō)是拉滿期待,就想看著國(guó)內(nèi)的大廠們,能不能拿出什么點(diǎn)新鮮玩意兒來(lái)讓大家開(kāi)開(kāi)眼。
但結(jié)果其實(shí)是有些失望。一句話概況就說(shuō),即便不去參展,也基本能猜出每個(gè)廠商擺出的主要產(chǎn)品是什么。例如百度的基本圍繞文心一言做落地,阿里圍繞通義千問(wèn),智譜AI圍繞智譜大模型,從娛樂(lè)社交到辦公學(xué)習(xí),大模型的主要作用十分明顯。
看似高大上的落地應(yīng)用,本質(zhì)還是集中在各類對(duì)話助手、文生圖、文生視頻產(chǎn)品。行業(yè)發(fā)展到今天,這些產(chǎn)品的新鮮感早已褪去,以至于現(xiàn)場(chǎng)有觀眾參展下來(lái)表示,每一家的產(chǎn)品都大差不差。
當(dāng)然,確實(shí)也有一些劍走偏鋒的落地思路,但仔細(xì)來(lái)看也只是特定行業(yè)特調(diào)的,基本也沒(méi)什么新意。
如果說(shuō)去年的WAIC讓人感覺(jué)AI有盼頭,大家瘋狂期待大廠商們爭(zhēng)奇斗艷能卷出哪些五花八門的產(chǎn)品,結(jié)果短短一年,齊刷刷地長(zhǎng)成了一個(gè)模子刻出來(lái)的樣子。
不過(guò)相比BAT這樣的大廠可以用大模型服務(wù)內(nèi)部業(yè)務(wù)生態(tài),以及用內(nèi)部生態(tài)為AI業(yè)務(wù)輸血,快手、B站、階躍星辰、Minimax、智譜AI這些設(shè)計(jì)大模型不久的公司算是第一次登場(chǎng),他們更焦慮于如何站穩(wěn)腳跟后茁壯成長(zhǎng)。
中小廠焦慮盡顯
這一波AI落地潮,對(duì)于中小廠來(lái)說(shuō)并不算友好。
比如,展臺(tái)緊靠阿里的階躍星辰,雖然入場(chǎng)雖晚,但極力想擠入“大模型五小虎”的戰(zhàn)隊(duì)中,在營(yíng)銷上試圖把格局改變?yōu)椤傲?qiáng)”。
在WAIC上發(fā)布了三個(gè)大模型,其中包括 Step-2:萬(wàn)億參數(shù)的 MoE 模型,目前還需要申請(qǐng)才能體驗(yàn);Step-1.5V:千億參數(shù)多模態(tài)模型,除了圖片理解能力提升外,也支持視頻理解;Step-1X:圖像生成模型,DiT 架構(gòu),600M、2B、8B 三種不同的參數(shù)量。
不過(guò)一個(gè)疑問(wèn)是,靠這三個(gè)模型還有出路嗎?去年的百模大戰(zhàn)造成了社會(huì)資源的巨大浪費(fèi),尤其是算力浪費(fèi),行業(yè)不卷模型,卷應(yīng)用,已經(jīng)成了共識(shí),沒(méi)有落地應(yīng)用已經(jīng)很難出圈,甚至很難拿到融資。
快手也是今年WAIC上的新面孔,從快手大模型家族來(lái)看,其著力點(diǎn)更具有落地屬性,重點(diǎn)是通過(guò)大模型打開(kāi)商業(yè)化的空間,以及通過(guò)視頻生成技術(shù)給自身的視頻業(yè)務(wù)注入新生機(jī)。
這里值得一提的是快手可靈,在文生視頻領(lǐng)域上,號(hào)稱比肩Sora,但目前試用范圍依舊無(wú)法完全匹配市場(chǎng)需求,即便是快手內(nèi)部的人想試用都很困難。并且當(dāng)下使用的結(jié)論,是基于內(nèi)測(cè)視頻得出,這也就意味著對(duì)于可靈的模型能力可能是高估的。更為關(guān)鍵的是雖然目前國(guó)內(nèi)市場(chǎng)尚無(wú)對(duì)手,但更多的競(jìng)爭(zhēng)對(duì)手正在趕來(lái)的路上。
另外一些像智譜AI這些純AI創(chuàng)業(yè)公司,在巨頭環(huán)繞的市場(chǎng)環(huán)境下,需要迫切找到自身的市場(chǎng)定位。以智譜AI為例,盡管在B端市場(chǎng)有所布局,但用戶群體的模糊邊界使得其在市場(chǎng)定位上面臨困惑。企業(yè)必須在產(chǎn)品和服務(wù)中融入獨(dú)特的價(jià)值主張,以區(qū)別于競(jìng)爭(zhēng)對(duì)手,而這在技術(shù)趨同的背景下顯得尤為困難。
新興AI企業(yè)大多處于初創(chuàng)或成長(zhǎng)階段,資本運(yùn)作的不確定性增加了財(cái)務(wù)壓力。一方面,高昂的研發(fā)成本和市場(chǎng)開(kāi)拓費(fèi)用需要持續(xù)的資本注入;另一方面,投資者對(duì)回報(bào)的期待與企業(yè)成長(zhǎng)周期的矛盾,使得財(cái)務(wù)規(guī)劃變得異常復(fù)雜。
而做特展的公司,參加一趟WAIC,成本最少也要幾十萬(wàn)。對(duì)于這些小企業(yè)來(lái)說(shuō),這些錢花出去要“擲地有聲”,要么收獲訂單,要么打響品牌。對(duì)于智譜AI,以及云服務(wù)廠商等重視企業(yè)服務(wù)的公司來(lái)說(shuō),花幾十萬(wàn)“買”最終客戶資源,性價(jià)比并不高。只是展會(huì)之后,如何保障對(duì)B端用戶的繼續(xù)跟蹤及成交,十分考驗(yàn)企業(yè)的售后能力。
構(gòu)建開(kāi)放的生態(tài)系統(tǒng),與行業(yè)伙伴建立合作關(guān)系,對(duì)于新興AI企業(yè)至關(guān)重要。但如何在短時(shí)間內(nèi)建立起有效的生態(tài)鏈,實(shí)現(xiàn)資源共享和價(jià)值共創(chuàng),是擺在這些企業(yè)面前的現(xiàn)實(shí)難題。
一年前,AI行業(yè)還在普及大模型的路上,把大模型的概念傳播給普通人。而如今AIGC、大模型起碼在行業(yè)上已經(jīng)有了廣泛的應(yīng)用,和不錯(cuò)的商業(yè)前景。所謂的千篇一律也可以理解為當(dāng)下行業(yè)的最優(yōu)解,在這個(gè)現(xiàn)實(shí)與虛擬交互的臨界點(diǎn),現(xiàn)在的平靜或許是為了未來(lái)的爆發(fā),畢竟在AI時(shí)代,每一天都變得值得期待。