文|光子星球 郝 鑫
編輯|吳先之
沉寂已久的AI語音賽道,因GPT4o又熱鬧起來了。
語音開源項(xiàng)目ChatTTS爆火出圈,能笑、能模仿還能實(shí)時(shí)互動(dòng);主打共情AI語音的Hume AI趁勢(shì)推出了第一個(gè)AI情感互動(dòng)播客產(chǎn)品;AI音視頻基礎(chǔ)設(shè)施平臺(tái)初創(chuàng)公司LiveKit宣布籌集2250萬美元的A輪融資,OpenAI和Character.AI都是其客戶。
自大模型浪潮席卷而來,AI語音賽道經(jīng)歷了從克隆、合成到實(shí)時(shí)反饋、情感化的變化。
在大模型多模態(tài)進(jìn)化的主線之下,AI語音一直像“影子”般存在。作為工具屬性的痕跡尤其明顯,它是狼人殺游戲里NPC發(fā)號(hào)的指令,是數(shù)字人表演的一環(huán),也是Sora生成視頻后的背景樂。
正因如此,語音的價(jià)值被低估了。
聲音打通的是無數(shù)個(gè)場,游戲的、帶貨的、教育的等等,最后抵達(dá)的是用戶。在大模型時(shí)代,把聲音功能前置是一種典型的產(chǎn)品思維,這意味著更低的門檻、更高效的交互方式以及更龐大的用戶群體。
“這幾乎是我第一次熬夜看美國科技產(chǎn)品發(fā)布會(huì),很多場景能夠被解鎖,十分驚艷”,瀾碼科技創(chuàng)始人周健掩按捺不住內(nèi)心的激動(dòng)。
GPT4o進(jìn)一步打開了多模態(tài)的想象力。當(dāng)補(bǔ)齊了語音模態(tài)這塊拼圖后,主打原生交互體驗(yàn)的產(chǎn)品被推向了商業(yè)化落地的邊緣,其背后是一批等待突圍的情感陪伴類大模型應(yīng)用產(chǎn)品。
不同于數(shù)字人、智能客服的toB模式,面向C端的AI產(chǎn)品同樣競爭激烈,MiniMax“星野”、字節(jié)“貓箱”和“小黃蕉”、百度“萬話”、美團(tuán)“Wow”、閱文“筑夢(mèng)島”、聆心智能“Aiu”,正在排隊(duì)等待下一場Kimi式的爆火。
語音激活客服、情感陪伴
TTS(文本轉(zhuǎn)語音)在語音賽道已經(jīng)是一項(xiàng)比較成熟的技術(shù)。大模型爆火初期,就有一些創(chuàng)業(yè)公司入局該領(lǐng)域,通過精調(diào)小參數(shù)模型來實(shí)現(xiàn)克隆、還原聲音的功能,以出售“聲音皮膚”或被集成到原有的游戲、直播等場景中來提供服務(wù)。
但在實(shí)際落地中,語音淪為了蛋糕上的裝裱。
以典型的智能客服行業(yè)為例,智齒科技向光子星球透露,“語音在業(yè)務(wù)中僅承擔(dān)了通道的角色,最終決定客戶是否買單,還是解決問題的效率和準(zhǔn)確率。”在這種情況下,很少有客戶直接提出要定制化聲音客服的需求。
“大模型來臨前,在客服營銷場景中,語音技術(shù)已經(jīng)可以做到百毫秒內(nèi)響應(yīng)”,智齒科技表示道。
大模型創(chuàng)業(yè)者曾在公開采訪中表示,GPT4o技術(shù)實(shí)現(xiàn)上難度不太大,“直接把語音模型和語言模型合在了一起”。
GPT4o或許不夠驚艷,但落地產(chǎn)品可以用“打通任督二脈”來形容,本質(zhì)上多模態(tài)讓AI應(yīng)用和場景“活”了起來。
免費(fèi)、靈活調(diào)用、情感化、無延遲互動(dòng)反饋,是本次GPT4o升級(jí)的關(guān)鍵詞。眾多行業(yè)和賽道中,語音客服和情感陪伴類產(chǎn)品成為了第一批受益者。
智齒科技告訴光子星球,客服系統(tǒng)以前也有情緒打分評(píng)價(jià),但是方式比較簡單粗暴,更多是通過詞語表面?zhèn)鬟_(dá)的含義來判斷,比如“累、困”這類字眼就與情緒低落相聯(lián)系,但是機(jī)器感受不到用戶的情緒波動(dòng)。
在加入情感因素后,可以通過捕捉客戶聲音的大小、急緩變化來判斷響應(yīng)的緊急性。“用戶說話特別激動(dòng),特別大的時(shí)候,就得立馬人工介入了,再使用機(jī)器人就得出問題”,智齒科技表示道。
于是,語音只是通道和承載容器的現(xiàn)狀被打破了。在智能客服營銷場景,語音變成了新維度的增值信息,用來做決策參考。
同樣立竿見影的效果也發(fā)生在情感陪伴類產(chǎn)品賽道。
觀察國內(nèi)外AI原生應(yīng)用,會(huì)發(fā)現(xiàn)一個(gè)共同的邏輯,凡是瞄準(zhǔn)C端用戶的產(chǎn)品,就會(huì)在一開始內(nèi)嵌語音功能。這樣的例子比比皆是,比如國外的Character.AI、Pi、Digi,國內(nèi)的豆包、星野、貓箱等。
語音前置的產(chǎn)品思維,首先是為了降低使用門檻,來擴(kuò)大適用人群的范圍,這是能成為Super App的前提條件之一。同時(shí),相較于文字,語音的媒介更容易抵達(dá)用戶,上述列舉的AI應(yīng)用不約而同地都指向了體驗(yàn)、陪伴和情緒價(jià)值。
同樣是對(duì)話生成,在國內(nèi)外分野出了兩條賽道,一類是效率類工具,一類是情感陪伴類產(chǎn)品。效率和情感類產(chǎn)品站在了大模型幻覺的兩極,前者是盡可能杜絕,后者則是放大化。
在國內(nèi),Kimi打響了效率類工具的爭奪戰(zhàn),靠在B站、抖音、小紅書等平臺(tái)投流占領(lǐng)用戶心智,完成了破圈傳播。然而,在無人在意的角落,MiniMax的情感陪伴類產(chǎn)品星野也在嘗試占據(jù)“中國ChatGPT”、“智能助手”一類相同的詞條獲得關(guān)注。
在GPT4o之前,情感陪伴類的產(chǎn)品只能算得上半截子產(chǎn)品,多以靜態(tài)的文字交互為主。最能抵達(dá)用戶,穿透場景直接傳遞感情溫度的語音則更像是順手設(shè)置的功能。待多模態(tài)大范圍應(yīng)用后,一批情感陪伴類的產(chǎn)品將迎來升級(jí),能夠主動(dòng)捕捉用戶的需求和情感變化,以更加人格化的方式與用戶實(shí)時(shí)互動(dòng)交流。
一如MiniMax 創(chuàng)始人兼 CEO 閆俊杰所判斷,“大模型在多模態(tài)的每一次進(jìn)步,都會(huì)帶來用戶體驗(yàn)的提升、獲得更高的用戶滲透率。比如,當(dāng) GPT-4o 擁有更絲滑的語音交互(延時(shí)縮短、增加情感等)后,它就會(huì)走向更多人?!?/p>
情感類AI應(yīng)用產(chǎn)品等待爆發(fā)
國內(nèi)情感陪伴類AI應(yīng)用產(chǎn)品等待著升級(jí),更等待著爆發(fā)。
這類應(yīng)用實(shí)際上是披著小說外殼的智能體“大禮包”,目前有兩類玩家在押注這個(gè)賽道。
一類是老牌玩家,有百度的“萬話”、美團(tuán)的“Wow”、閱文的“筑夢(mèng)島”、字節(jié)的“貓箱”等,這類公司的特點(diǎn)是資源豐富,有大量的應(yīng)用場景,也有資本砸錢投流營銷;另一類是年輕的大模型公司玩家,如Minimax的“星野”、清華系聆心智能的“Aiu”等,這類公司對(duì)于AI原生的理解更具想象力,愿意投入大量的精力和資源All in 應(yīng)用層。此外,豆包、通義、智譜清言等效率助手也內(nèi)嵌了大量偏娛樂向的智能體。
國內(nèi)大部分的情感類產(chǎn)品都在不同程度上對(duì)標(biāo)Character.AI。Character.AI在社交娛樂賽道上遙遙領(lǐng)先,已經(jīng)成長為僅次于ChatGPT的全球第二大AI應(yīng)用。數(shù)據(jù)顯示,Character.AI總月活用戶超過了千萬,活躍用戶日均使用時(shí)長超過了2個(gè)小時(shí)。
相關(guān)研究機(jī)構(gòu)預(yù)測,2024年將會(huì)是情感陪伴類產(chǎn)品爆發(fā)式增長一年。但目光聚焦到國內(nèi),暫時(shí)無法能找到與Character.AI差不多量級(jí)的情感類AI應(yīng)用。在這種情況下,也許多模態(tài)能成為一個(gè)新的突破口。
延續(xù)著Character.AI的路線,市面上的大部分玩家都想做AI時(shí)代的UGC內(nèi)容社區(qū)。從內(nèi)容上做進(jìn)一步劃分,有偏向游戲化的星野,將故事對(duì)話、抽卡、集小卡等游戲的玩法融入到了應(yīng)用中;有融合了專業(yè)心理咨詢指導(dǎo)的Aiu,也有乙女向的萬話、筑夢(mèng)島、貓箱等。
在如何做產(chǎn)品上,新老玩家呈現(xiàn)出了截然不同的態(tài)度。老玩家要復(fù)制曾經(jīng)成功過的自己,新玩家則更想創(chuàng)造一個(gè)全新的AI原生應(yīng)用。
在資深玩家的身上總能找到過去產(chǎn)品的影子。
閱文開發(fā)的筑夢(mèng)島文字感極強(qiáng),幾乎與閱讀小說的體驗(yàn)一樣,里面有不少閱文旗下IP化的小說人物角色智能體。閱文筑夢(mèng)島為智能體打的標(biāo)簽、角色介紹以及對(duì)話細(xì)節(jié)的刻畫,在當(dāng)前仍以文字交互為主的狀態(tài)下,代入感會(huì)更強(qiáng)。
(圖源:閱文筑夢(mèng)島)
開啟智能體角色對(duì)話模式后,產(chǎn)品體驗(yàn)感類似于主打互動(dòng)式文字游戲的橙光。贈(zèng)送禮物、購買日卡、月卡,吸引用戶付費(fèi)的方式也與閱讀小說如出一轍。
當(dāng)前各個(gè)應(yīng)用為了聚集用戶,對(duì)智能體的創(chuàng)建沒有明確的限制,但長期以往,IP版權(quán)會(huì)成為一項(xiàng)競爭力,屆時(shí)閱文的優(yōu)勢(shì)將凸顯出來。閱文依舊可以通過授權(quán)IP,將熱門影視作品IP的主要人物打造成智能體,來延長IP生命周期,打通新的變現(xiàn)渠道。
字節(jié)的貓箱就像是另一個(gè)抖音,上下滑動(dòng)可以隨機(jī)掉落不同的智能體,一鍵點(diǎn)擊加號(hào)可以創(chuàng)建智能體,點(diǎn)擊作者名字可以關(guān)注,進(jìn)入頁面還能查看該作者的其他作品。因此,相較于其他應(yīng)用,貓箱一進(jìn)主頁就給了人一種熟悉感,也就更容易上手試玩。
(圖源:字節(jié)貓箱)
貓箱的前身是話爐,雖然在今年才正式上線,但早在去年字節(jié)就靠海外AI產(chǎn)品賽馬的方式積累了大量經(jīng)驗(yàn)。另據(jù)光子星球了解,為了獲得更精準(zhǔn)的反饋數(shù)據(jù),字節(jié)曾招聘專門的人員來訓(xùn)練智能體。所以,字節(jié)貓箱一上線就呈現(xiàn)出了較成熟的產(chǎn)品形態(tài)。背靠抖音的流量大池,貓箱獲得了大量的曝光機(jī)會(huì),有豆包的用戶增長案例在前,貓箱有很大潛力出圈成為下一個(gè)爆款。
星野等新應(yīng)用雖然看不到太多互聯(lián)網(wǎng)的痕跡,但是整個(gè)賽道面臨著和效率工具同樣的問題,同質(zhì)化嚴(yán)重。目前,除了星野建立了一點(diǎn)用戶心智,剩下的應(yīng)用產(chǎn)品似乎都站在了同一起跑線上,當(dāng)大家的玩法差不多,誰先能像Kimi一樣出圈,誰就擁有了主動(dòng)權(quán)。
AI女友,危險(xiǎn)的“現(xiàn)金?!?/h4>
AI情感類產(chǎn)品經(jīng)常被戲謔為“AI女友”項(xiàng)目,字節(jié)“空降”的小黃蕉應(yīng)用,從二次元走向了真人,直接貼上了AI虛擬交友的標(biāo)簽。
盡管OpenAI的奧特曼曾經(jīng)在公開場合表達(dá)過對(duì)“AI女友”的不屑。
但有多位投資人對(duì)光子星球表示過,“當(dāng)大家都開始找PMF(產(chǎn)品與市場的匹配度)的時(shí)候,情感類是最確定的?!毖韵轮饩褪牵?dāng)用戶的使用規(guī)模和時(shí)長達(dá)到一定量級(jí)后,就自然能找到了PMF,其中AI情感類產(chǎn)品占有優(yōu)勢(shì)。
Kimi的出現(xiàn)打破了AI 1.0時(shí)代技術(shù)首先得靠B端變現(xiàn)的認(rèn)知,那在當(dāng)下效率工具卷生卷死的時(shí)間節(jié)點(diǎn),Character.AI、星野也在提醒大家,情緒所帶來的價(jià)值依然不可忽略。
在付費(fèi)意愿普遍不那么強(qiáng)烈的大環(huán)境下,頂著投資人壓力的Kimi在商業(yè)化變現(xiàn)上也抓住了“情緒價(jià)值”的關(guān)鍵點(diǎn),通過鼓勵(lì)用戶打賞的迂回策略,來緩解投流和運(yùn)營成本的壓力。
光子星球在接觸創(chuàng)業(yè)者的過程中發(fā)現(xiàn),做C端AI應(yīng)用產(chǎn)品早期獲取用戶的難度沒有想象中困難,只要能精準(zhǔn)觸達(dá)到有特定情感需求的目標(biāo)用戶,即使是長尾產(chǎn)品也能產(chǎn)生付費(fèi)。
有的人在國內(nèi)上線產(chǎn)品,第一個(gè)訂閱付費(fèi)用戶卻產(chǎn)生在遠(yuǎn)隔千里之外的大洋彼岸;有的創(chuàng)業(yè)者被追著加微信,基于產(chǎn)品體驗(yàn)效果搶著付費(fèi)。
AI情感陪伴類產(chǎn)品,難的不是找到嘗鮮付費(fèi)的用戶,而是能夠持續(xù)加深用戶與應(yīng)用之間的綁定關(guān)系,篩選出重度用戶,不斷地產(chǎn)生付費(fèi)行為。
在留下用戶方面,AI情感陪伴應(yīng)用有天然的優(yōu)勢(shì),Character.AI的日活躍用戶使用時(shí)長已經(jīng)超過了ChatGPT。閆俊杰在采訪中也直言,“fantasy(星野)產(chǎn)品,挺夸張的,是很長的時(shí)長”。
GPT4o實(shí)現(xiàn)了端到端的視覺、語音聯(lián)動(dòng),端側(cè)的價(jià)值正在逐漸凸顯。
數(shù)據(jù)顯示,ChatGPT 移動(dòng)應(yīng)用程序的凈收入在 GPT-4o 推出的當(dāng)天首次增長了22%。截至到5月17日,ChatGPT 移動(dòng)應(yīng)用在 App Store 和 Google Play 兩個(gè)平臺(tái)上共賺取了 420 萬美元的凈收入。
(圖源:Appfigures)
據(jù)白鯨出海報(bào)道,海外版星野——Talkie ,截至今年4月份,Talkie累計(jì)下載將近 1400 萬(不包含中國大陸)、累計(jì)營收將近 83 萬美元。有接近 Talkie 人士透露,Talkie 已經(jīng)實(shí)現(xiàn)了 ROI 轉(zhuǎn)正。
效率類的智能助手需要考慮小程序、網(wǎng)頁、手機(jī)應(yīng)用跨端的適配,但情感陪伴類的產(chǎn)品主要在端側(cè)。用戶黏性加上端側(cè)潛在的增長潛力,buff疊加后,盡管“AI女友”不是一個(gè)好項(xiàng)目,但是似乎是一門好生意。
問題是,目前的大部分產(chǎn)品的情感價(jià)值濃度還遠(yuǎn)遠(yuǎn)不夠,這就導(dǎo)致讓用戶長期付費(fèi)暫時(shí)還很困難。
顯然,賽道上的玩家也意識(shí)到了這個(gè)問題,于是采用了免費(fèi)+付費(fèi)的模式來推進(jìn)商業(yè)化。短期來看,免費(fèi)可以讓更多用戶試玩應(yīng)用,產(chǎn)生的數(shù)據(jù)和留下的反饋評(píng)價(jià),這些數(shù)據(jù)可以反過來喂養(yǎng)底層模型,增強(qiáng)應(yīng)用的體驗(yàn)效果。長期一點(diǎn),各家致力于做內(nèi)容社區(qū),如同抖音一樣,未來需要有大量的UGC、PGC內(nèi)容撐起整個(gè)生態(tài)。
當(dāng)前階段的產(chǎn)品付費(fèi),距離情緒價(jià)值“買單”還很遠(yuǎn),更多體現(xiàn)在功能付費(fèi)上。作為情感陪伴類的產(chǎn)品,理想的情況是,用戶付費(fèi)是為了解鎖與智能體更深度、親密、互動(dòng)頻繁的關(guān)系。
(圖源:左星野,右Character.AI)
但現(xiàn)狀是,迫于技術(shù)、算力上的局限,用戶不得不為自動(dòng)播放語音、更長線的記憶能力、更快速的對(duì)話反饋來訂閱付費(fèi)。
具有爆款潛質(zhì)的AI情感陪伴類的應(yīng)用,可能先要思考如何最大程度上滿足用戶需求。