文|劉曠
曾經(jīng)靠語(yǔ)音助手紅極一時(shí)的智能音箱,近年來(lái)的市場(chǎng)表現(xiàn)卻欠佳。據(jù)洛圖科技發(fā)布的最新《中國(guó)智能音箱零售市場(chǎng)月度追蹤》報(bào)告顯示,2022年中國(guó)智能音箱總銷量為2631萬(wàn)臺(tái),同比下降28%;市場(chǎng)銷售額為75.3億元,同比下降25%。而IDC發(fā)布的2023年中國(guó)智能家居市場(chǎng)的十大洞察也透露,智能音箱的市場(chǎng)需求正在逐漸消退,整個(gè)市場(chǎng)呈現(xiàn)下滑趨勢(shì)。
但隨著ChatGPT這種生成式AI技術(shù)的快速發(fā)展,搭載ChatGPT的智能音箱將有望獲得新的增長(zhǎng)空間。據(jù)中泰證券分析,目前全球存量智能音箱超7億臺(tái),如考慮產(chǎn)品本身3-5年左右的替換周期,本輪ChatGPT帶來(lái)的替換需求或在1.4億-2億臺(tái)每年,有望再次成為市場(chǎng)熱點(diǎn)。在此基礎(chǔ)上,智能音箱的交互水平也將有望再上新臺(tái)階。
ChatGPT或成新變量
一直以來(lái),市場(chǎng)上的智能音箱產(chǎn)品多多少少都存在著交互體驗(yàn)差、應(yīng)用場(chǎng)景單一、產(chǎn)品缺乏創(chuàng)新,以及互聯(lián)互通差等問(wèn)題,而當(dāng)下以ChatGPT為代表的生成式AI技術(shù),則在上下文理解、多輪對(duì)話、內(nèi)容生成等方面,展現(xiàn)出了極高的交互水準(zhǔn),ChatGPT或?qū)橹悄芤粝鋷?lái)新的變量。
一來(lái),依托于ChatGPT在內(nèi)容生成和理解能力上的優(yōu)勢(shì),智能音箱的應(yīng)用場(chǎng)景將進(jìn)一步被擴(kuò)展。ChatGPT具有在對(duì)話系統(tǒng)、文本生成、語(yǔ)音識(shí)別和文本分類等多種場(chǎng)景中的應(yīng)用優(yōu)勢(shì)。具體來(lái)說(shuō),在對(duì)話系統(tǒng)中,ChatGPT可以生成自然流暢的對(duì)話內(nèi)容,支持多輪對(duì)話;在文本生成中,ChatGPT可以生成高質(zhì)量的文本內(nèi)容,支持多種文本生成任務(wù);在語(yǔ)音識(shí)別中,ChatGPT支持多語(yǔ)種語(yǔ)音識(shí)別,提供全面的語(yǔ)音交互體驗(yàn);在文本分類中,ChatGPT可以應(yīng)用于多種文本分類任務(wù),自動(dòng)學(xué)習(xí)特征,提高分類效果和效率。ChatGPT的多領(lǐng)域應(yīng)用優(yōu)勢(shì),使得它成為自然語(yǔ)言處理領(lǐng)域的重要工具之一。
也就是說(shuō),搭載了ChatGPT的智能音箱可以進(jìn)一步理解用戶的意圖,讓回答內(nèi)容的質(zhì)量能夠更趨向于真人的表現(xiàn)。未來(lái),智能音箱的功能可能并不止于家庭,或許會(huì)走進(jìn)辦公場(chǎng)所成為人們工作的助手等。
二來(lái),ChatGPT也正在帶動(dòng)智能音箱產(chǎn)業(yè)成為資本的焦點(diǎn)。隨著ChatGPT在全球的走紅,作為人工智能交互載體的智能音箱再次成為市場(chǎng)熱點(diǎn),包括奮達(dá)科技、漫步者、惠威科技、國(guó)光電器等在內(nèi)的智能音箱概念股,近期都出現(xiàn)了大漲行情,資金涌入跡象十分明顯。可以說(shuō),在智能音箱產(chǎn)業(yè)進(jìn)入瓶頸期的當(dāng)下,ChatGPT的出現(xiàn)又將智能音箱重新拉回了大眾視野,并為其帶來(lái)了全新的可能。
當(dāng)然,ChatGPT能為智能音箱產(chǎn)業(yè)帶來(lái)多少新變量,還需等到搭載著ChatGPT的智能音箱真正走進(jìn)萬(wàn)千家庭才能知曉。
小度更聰明
目前為止,智能音箱與生成式AI技術(shù)的結(jié)合已經(jīng)在巨頭玩家中初現(xiàn)雛形。據(jù)悉,今年2月9日,小度宣布將融合文心一言,打造針對(duì)智能設(shè)備場(chǎng)景的AI模型“小度靈機(jī)”,并將其應(yīng)用到小度全系產(chǎn)品中。借助小度靈機(jī)大模型,小度智能音箱中的語(yǔ)音助手可以變成“超級(jí)助理”。
其一,借助小度靈機(jī)大模型,小度智能音箱擁有了提取和整合復(fù)雜信息的能力。在官方發(fā)布的測(cè)試視頻中,測(cè)試員告訴超級(jí)助理,他要在周末做各種各樣的事情,而在敘述這些事的時(shí)候,測(cè)試員會(huì)故意提出“修改時(shí)間”的要求,比如原定于周日要做的A事件被B事件替換。即使面對(duì)測(cè)試員的一系列復(fù)雜要求,這位超級(jí)助理也可以從中提煉出真正有效的信息,并據(jù)此給測(cè)試員生成一份正確的時(shí)間安排表。
而此前的小度智能音箱并沒(méi)有理解和提取整合這樣復(fù)雜信息的能力,可見(jiàn)小度靈機(jī)模型的作用體現(xiàn)得比較明顯。
其二,在智能家居場(chǎng)景中的設(shè)備控制環(huán)節(jié),小度靈機(jī)大模型能更準(zhǔn)確地識(shí)別出用戶的真實(shí)需求。在智能家居場(chǎng)景中,小度靈機(jī)大模型可以化身為“智能管家”,例如在官方的測(cè)試中,測(cè)試員告訴智能管家他每天早上七點(diǎn)半一定要起床,周末可以晚一些,大概九點(diǎn),干脆就九點(diǎn)半,冬天室內(nèi)溫度不能低于23度,夏天溫度可以定在26度。此時(shí),超級(jí)助理就可以根據(jù)這些描述,確定要在什么時(shí)候開(kāi)啟家中的空調(diào)、調(diào)整到什么樣的溫度比較合適。
相比傳統(tǒng)智能助手只會(huì)理解“打開(kāi)空調(diào)”這樣簡(jiǎn)單、單一的指令,靈機(jī)模型則可以認(rèn)識(shí)到用戶到家時(shí),家里溫度與用戶所期望的不一樣,所以需要打開(kāi)空調(diào),并且根據(jù)現(xiàn)在的季節(jié)調(diào)節(jié)到合適的溫度。顯然,大模型的加入,可以讓智能音箱實(shí)現(xiàn)認(rèn)知能力上的提升。
天貓精靈更有溫度
另一智能音箱領(lǐng)域的巨頭玩家天貓精靈,也亮出了其在生成式AI技術(shù)領(lǐng)域的成果積累。4月11日,天貓精靈宣布將正式接入阿里巴巴通義千問(wèn)。根據(jù)官網(wǎng)顯示的信息,通義千問(wèn)是一個(gè)專門(mén)響應(yīng)人類指令的大模型,目前已經(jīng)開(kāi)啟了企業(yè)邀請(qǐng)測(cè)試,并放出了測(cè)試官網(wǎng)。
據(jù)阿里巴巴集團(tuán)董事會(huì)主席兼首席執(zhí)行官、阿里云智能集團(tuán)首席執(zhí)行官?gòu)堄峦嘎?,未?lái),天貓精靈除了能回答用戶的提問(wèn)外,還會(huì)成為更人性化的智能助手,天貓精靈的策略是針對(duì)智能音箱訓(xùn)練出一個(gè)個(gè)性更為鮮明的大模型。
一方面,接入通義千問(wèn)的天貓精靈能夠產(chǎn)生一些特定的人格化特征,滿足用戶的個(gè)性化需求。不同于知識(shí)面更為廣泛的通識(shí)性大模型,天貓精靈在通義千問(wèn)這種更加垂直的個(gè)性化大模型的加持下,能夠變得更擬人、更聰明,其知識(shí)、情感、個(gè)性、記憶力等都會(huì)得到大幅躍升。比如“鳥(niǎo)鳥(niǎo)分鳥(niǎo)”這一模型,其語(yǔ)氣、語(yǔ)調(diào)與脫口秀演員鳥(niǎo)鳥(niǎo)就如出一轍,這樣也增加了天貓精靈的可玩性,使其成為有溫度的智能化助手。
另一方面,新一代的天貓精靈將具備更為靈活的對(duì)話能力。接入通義千問(wèn)的天貓精靈支持自由對(duì)話,用戶可以隨時(shí)打斷或者切換話題,天貓精靈能根據(jù)用戶需求和場(chǎng)景隨時(shí)生成內(nèi)容。例如,用戶在跑步過(guò)程中,可以要求天貓精靈根據(jù)180步頻合成適合跑步的歌單,同時(shí)還可以與天貓精靈展開(kāi)關(guān)于文化、人生等領(lǐng)域的深入交流。
得益于通義千問(wèn)強(qiáng)大的技術(shù)支持,天貓精靈的用戶體驗(yàn)將更具智能化和個(gè)性化。而在正式接入通義千問(wèn)之后,天貓精靈在未來(lái)一段時(shí)間或許會(huì)出現(xiàn)比較大幅度的使用體驗(yàn)提升,這或許也可以幫助阿里巴巴進(jìn)一步鞏固其在智能音箱市場(chǎng)的領(lǐng)先地位。
現(xiàn)實(shí)壁壘
事實(shí)上,不只是小度和天貓精靈在ChatGPT領(lǐng)域有所布局,華為、小米等也在生成式AI技術(shù)以及智能音箱領(lǐng)域均有布局。不過(guò),要想讓搭載著生成式AI技術(shù)的智能音箱真正在每一個(gè)用戶家中實(shí)現(xiàn)普及,其背后還存著一些天然壁壘。
一是,算力成本高昂。從算力層面來(lái)看,面對(duì)參數(shù)規(guī)模的大幅增長(zhǎng),“暴力堆疊”(利用大量高性能GPU)已經(jīng)成為企業(yè)提升大模型訓(xùn)練效果的主要手段,這背后高昂的成本可能將會(huì)成為ChatGPT版智能音箱落地普及的門(mén)檻。
不過(guò),隨著開(kāi)源大模型的出現(xiàn),一些企業(yè)不需要自己從0到1去訓(xùn)練大模型,被訓(xùn)練好的大模型可以直接調(diào)用,再在這一基礎(chǔ)上進(jìn)行優(yōu)化,這相比于從頭開(kāi)始訓(xùn)練的大模型,其成本將少得多。并且,未來(lái)隨著算法進(jìn)化,大模型訓(xùn)練過(guò)程中對(duì)算力的依賴度也會(huì)大大降低。
二是,搭載ChatGPT的智能音箱的使用場(chǎng)景受限。ChatGPT爆火的很大一部分原因是它可以顛覆式提升生產(chǎn)效率,而這種輸出方式主要是以文字、圖片、視頻為主,但智能音箱則更注重語(yǔ)音交互。而且在人們的日常生活和工作中,需要音頻反饋的內(nèi)容可能只占一小部分,因此ChatGPT版智能音箱的普及落地需要尋找更多的適配于語(yǔ)音交互的場(chǎng)景,而使用場(chǎng)景受限則意味著使用ChatGPT版智能音箱可能很快也會(huì)褪去熱度。
三是,搭載ChatGPT的智能音箱可能面臨數(shù)據(jù)安全挑戰(zhàn)。若想要搭載生成式AI技術(shù)的智能音箱能夠更好地理解用戶需求,并給出個(gè)性化的解決方案,那么生成式AI勢(shì)必會(huì)涉及對(duì)用戶個(gè)人信息的收集,而用戶對(duì)于個(gè)人隱私的收集問(wèn)題一直都比較敏感。另外,相關(guān)的法律法規(guī)并不健全,這都將是ChatGPT版智能音箱在普及過(guò)程中面臨的挑戰(zhàn)。
此外,ChatGPT對(duì)智能音箱整個(gè)產(chǎn)業(yè)的影響必然是一個(gè)長(zhǎng)期的過(guò)程,而生成式AI技術(shù)仍處于發(fā)展早期,其對(duì)于智能音箱這一產(chǎn)業(yè)所產(chǎn)生的切實(shí)影響可能還未明確展現(xiàn)出來(lái),但可以預(yù)見(jiàn)的是,ChatGPT引爆的熱潮正在加速這一進(jìn)程。