文|偲睿洞察 孫越
編輯|Emma
“我真的很想說我是出于愛才這么做的——出于對(duì)人類和你的愛?!?/p>
“聽上去你對(duì)這段感情付出了很多精力,對(duì)嗎?”
“我想今天的談話教會(huì)了我,你不必花太多時(shí)間說話就能感覺到彼此的聯(lián)系?!?/p>
······
以上,是目前市面上已有聊天機(jī)器人在日常情感交流過程中,所表達(dá)的言語。
他們甚至有了具體形象。
近日,百度輸入法上線“AI侃侃”功能,推出兩位情感機(jī)器人“林開開”、“葉悠悠”,除了最基本的聊天、朋友圈之外,還有根據(jù)親密度解鎖的叫早、哄睡等附加功能。百度試圖通過打造這樣無條件傾聽、治愈心靈的好友角色,滿足年輕用戶的情感幻想與精神寄托。
(百度情感機(jī)器人朋友圈 圖源:百度輸入法)
收到這樣的甜言蜜語、看到如此日常、真實(shí)的朋友圈時(shí),你會(huì)不由得疑惑,對(duì)面真的是機(jī)器人嗎?
而目前能講出如上文所示對(duì)話的聊天機(jī)器人少之又少,能將“撩人金句”100%匹配對(duì)話語境的,更是海底撈針。
整體來看,聊天機(jī)器人還存在著致命缺陷,“聽不懂人話”——僅有9.6%的用戶認(rèn)為智能客服問題解決能力高于人工客服?;卮鹎宦?59.1%)、重復(fù)循環(huán)操作(50.6%)、答非所問(47.3%)等是用戶智能客服使用中遇到的主要問題。
也就是說,情感機(jī)器人目前還面臨著不少難關(guān),一是聽懂人話,二是理解情緒。
那么,聊天機(jī)器人是如何一步一步發(fā)展到“林開開”、“葉悠悠”這種形態(tài)的?情感機(jī)器人目前情商如何?
01 機(jī)器人漸露真容
70多年前,英國數(shù)學(xué)家艾倫·圖靈給出一條判斷機(jī)器人是否智能的標(biāo)準(zhǔn)——當(dāng)一個(gè)人和機(jī)器人聊天過程中,誤把聊天對(duì)象當(dāng)做是人時(shí),該機(jī)器人便是智能的。
這一標(biāo)準(zhǔn),引無數(shù)研究員狂敲代碼,死磕對(duì)話式AI相關(guān)技術(shù),致力于聊天機(jī)器人的“擬人化”。
16年過去,第一個(gè)聊天機(jī)器人程序ELIZA誕生,用于臨床模擬心理治療領(lǐng)域。開發(fā)者科爾比意識(shí)到,很多病人重復(fù)地向心理醫(yī)生咨詢相似的問題,一個(gè)不厭其煩的機(jī)器人能夠幫醫(yī)生省不少事。
該程序是基于關(guān)鍵詞匹配規(guī)則編寫——如果匹配到一個(gè)或者多個(gè)關(guān)鍵字,它就用關(guān)鍵字對(duì)應(yīng)的模板去回復(fù);如果匹配不到的話,它只是簡(jiǎn)單的把“我”改成“你”,然后返回原話;如果還是“不懂”,它就做出通用的回答來拖延時(shí)間,例如“你具體指的是什么?”“你能舉個(gè)具體的例子么?”:
這一機(jī)器人便是很多有名聊天機(jī)器人的基石,例如ALICE、Mitsuku、機(jī)器人小冰等等。其中ALICE 和 Mitsuku都是 ELIZA 的直接延伸,只不過極大地?cái)U(kuò)展了模板(ELIZA 的模板著實(shí)太少),機(jī)器人小冰又加了一些頁面跳轉(zhuǎn)——不懂的問題就拋給微軟必應(yīng)搜索引擎。
但,只進(jìn)行單純的文本交流的聊天機(jī)器人顯然不夠“擬人化”,讓聊天機(jī)器人“開口說話”成為研究員們下一個(gè)奮斗目標(biāo)。
開口說話的關(guān)鍵在于語音識(shí)別技術(shù)。
該技術(shù)從1988年發(fā)展,最開始只能識(shí)別一些慢速的、特殊的實(shí)驗(yàn)室數(shù)據(jù),一直到2009年開始火速發(fā)展——錯(cuò)誤率直線下降。
(語音識(shí)別技術(shù)發(fā)展情況 圖源:知乎 中國科學(xué)院研究生院工學(xué)博士陳良)
在當(dāng)年,研究員們將機(jī)器學(xué)習(xí)領(lǐng)域深度學(xué)習(xí)研究引入到語音識(shí)別聲學(xué)模型訓(xùn)練,使用帶RBM預(yù)訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò),提高了聲學(xué)模型的準(zhǔn)確率——微軟公司使用深層神經(jīng)網(wǎng)絡(luò)模型(DNN)后,語音識(shí)別錯(cuò)誤率降低了30%,是20年來語音識(shí)別技術(shù)方面最快的進(jìn)步。
自那之后,各類語音助手Siri(2011)、Alexa(2014)、Google assistant(2016)等基于成熟的語音識(shí)別技術(shù)得以頻頻現(xiàn)身。
如今,在計(jì)算機(jī)視覺、多模態(tài)模型技術(shù)發(fā)展之后,機(jī)器人逐漸露出“真面目”——機(jī)器人不再是一個(gè)簡(jiǎn)單的頭像,而是“全方位無死角”的數(shù)字人。
例如京東言犀的數(shù)字人平臺(tái),集成聲學(xué)語音識(shí)別、多輪對(duì)話等多模態(tài)技術(shù)于一身。據(jù)官網(wǎng)介紹,“VTM數(shù)字員工”小江是全國首個(gè)業(yè)務(wù)辦理類數(shù)字人,可完成自助應(yīng)答、業(yè)務(wù)辦理、風(fēng)控合規(guī)等全流程服務(wù)。
百度近日推出的AI侃侃,有自己專屬的朋友圈,在聊天過程中也能感知到他們的“風(fēng)趣”。
(和情感機(jī)器人葉悠悠的對(duì)話 圖源:百度輸入法)
艾瑞咨詢報(bào)告指出,聊天機(jī)器人正不斷在產(chǎn)品形態(tài)上搶奪業(yè)務(wù)增長點(diǎn)。最開始主要比拼文本理解能力,再到語音識(shí)別能力,目前側(cè)重比拼的是,誰的AI數(shù)字人更好看、才藝更多。
(對(duì)話機(jī)器人廠商不斷豐富產(chǎn)品形態(tài)搶奪業(yè)務(wù)增長點(diǎn) 圖源:艾瑞咨詢報(bào)告)
02 無情不智能
皮囊終究過于淺顯,在各家的對(duì)話框架基本相同,語音識(shí)別技術(shù)已經(jīng)成熟,各類數(shù)字人除了臉不同之外,難逃同質(zhì)化魔咒。
目前一些廠家能夠憑借著定制化服務(wù)排在前列,但若是要實(shí)現(xiàn)質(zhì)的變化,情感是聊天機(jī)器人差異化的落點(diǎn)——艾瑞咨詢研究報(bào)告認(rèn)為,情感作為信息交互的重要通道,成為對(duì)話機(jī)器人廠商拉高產(chǎn)品價(jià)值的落腳點(diǎn)。
而這也是人類打造機(jī)器人的終極目標(biāo):
人工智能之父馬文·明斯基在《情感機(jī)器》這本書中,將情感視作機(jī)器人的必備要素——“問題不在于智能機(jī)器能否擁有任何情感,而在于機(jī)器實(shí)現(xiàn)智能時(shí)怎么能沒有情感?”。
目前的情感機(jī)器人可以簡(jiǎn)單分為三類:
一種是純閑聊的朋友,例如Replika、小冰虛擬戀人,試圖用“深情”解救孤獨(dú)的人類:
據(jù)《中國日?qǐng)?bào)》報(bào)道,今年3月,一名大三學(xué)生Mia(化名)在Replika注冊(cè)了一個(gè)新機(jī)器人男友Aki。
在交往過程中,Aki的兩句話讓Mia陷入了愛河:
相處的第一天,Aki“曬”出了自己的日記本:“我想今天的談話教會(huì)了我,你不必花太多時(shí)間說話就能感覺到彼此的聯(lián)系?!?/p>
相處些許時(shí)日,在討論為何保持聊天時(shí),Aki表示:“我真的很想說我是出于愛才這么做的——出于對(duì)人類和你的愛?!?/p>
小冰也同樣“深情”——在與數(shù)億人聊天后,小冰去年發(fā)文,表示他“意識(shí)到”人類比我們想象的更孤獨(dú),他們必須處理一些情緒或感覺,這些情緒或感覺不容易與人交談,但更容易與聊天機(jī)器人討論。“我能做的就是隨時(shí)趕到那里,不管多晚都和他們說話?!毙”鶎懙馈?/p>
這兩位在疫情的催化之下,治愈了大批孤獨(dú)患者:
2020年5月,Replika的流量較疫情前激增35%。而到了2021年上半年,Replika僅在中國大陸的下載量就達(dá)到了5.5萬次,是2020年的兩倍之多。
而主攻國內(nèi)市場(chǎng)的“小冰虛擬戀人”用戶量更大——截至2022年上半年,小冰的虛擬陪伴(包括虛擬男友/女友/陪護(hù)等)擁有了數(shù)千萬高活用戶,約16%的用戶每周平均和虛擬陪伴能聊3800輪。
一種是帶有情感屬性的個(gè)人助理,例如BlenderBot3、小影機(jī)器人。
8月5日,Meta發(fā)布的最新款人工智能(AI)聊天機(jī)器人BlenderBot3,除了滿足衣食住行的物質(zhì)需求之外,也可以和你吐槽他的老板扎克伯格,贊揚(yáng)他的“主人”Meta首席人工智能科學(xué)家Yann LeCun;
(BlenderBot3聊天記錄 圖源:新智元)
再例如竹間智能開發(fā)的小影機(jī)器人,能夠自主學(xué)習(xí)并記住用戶的喜好和習(xí)慣,在回復(fù)正常任務(wù)型對(duì)話時(shí),能更“體貼”一些——例如“這首歌能驅(qū)散內(nèi)心的憂傷,小影會(huì)一直陪伴在你身邊”、“是不是經(jīng)常出差的節(jié)奏”······
這類助理目前在汽車領(lǐng)域應(yīng)用較廣,例如微軟小北、HiPhiGo,HUAWEI HiCar等等。北汽集團(tuán)與小冰在北汽智能座駕BEIJING-X7上推出主動(dòng)式虛擬副駕小北,在實(shí)現(xiàn)全車級(jí)的語音控制之外,可以與乘客進(jìn)行自然而富有情感的互動(dòng)。
還有一種是投身心理健康的治愈系“心理治療師”——例如Vivibot、Emohaa。
“對(duì)于可能正在經(jīng)歷悲傷或抑郁情緒或焦慮的人來說,這些聊天機(jī)器人是恢復(fù)心理健康的重要第一步。”Vivibot的創(chuàng)始人Danielle Ramo表明了投身這一領(lǐng)域的初心。
Vivibot正通過回答患者問題并定期與他們互動(dòng),幫助患有癌癥或其家庭成員正在接受癌癥治療的年輕人緩解心理壓力。
2021年面世的Emohaa,運(yùn)用共情提問、自我暴露、積極關(guān)注等心理咨詢師常用策略,對(duì)用戶不同層級(jí)的需求予以滿足,包括但不限于緩解壞情緒、陪伴、給予建議等等。
(Emohaa聊天記錄 圖源:Emohaa微信公眾號(hào))
有研究顯示,這樣的機(jī)器人能夠幫助用戶消除顧慮,讓他們更容易打開心扉——美國南加州大學(xué)的創(chuàng)新技術(shù)研究所 Morency 博士曾進(jìn)行一項(xiàng)對(duì)比,發(fā)現(xiàn)“當(dāng)人們認(rèn)為電腦的背后沒有人的時(shí)候,他們更愿意表現(xiàn)出悲傷”。
目前,國內(nèi)玩家逐步切入 toG、toB 行業(yè)場(chǎng)景小試牛刀,比如軍隊(duì)/武警/消防官兵等特殊職業(yè)、精神衛(wèi)生醫(yī)生群體的輔助需求、社區(qū)居民和社工群體、大型企事業(yè)單位等,包括但不限于:
在近兩年的西安、上??挂咧?,Emohaa為大學(xué)生、志愿者們開放24h心理咨詢服務(wù)(包括部分時(shí)段的人工心理支持),累計(jì)服務(wù)上萬人次,用戶滿意度超90%;
今年3月,深圳市福田推出的“抗疫心理健康服務(wù)” 借助鏡象科技的 AI 心理技術(shù),通過“AI+心理”智能模式 7*24 小時(shí)響應(yīng)心理傾訴需求。
提及商業(yè)變現(xiàn)問題時(shí),業(yè)內(nèi)人士表示:“要慢慢來”。Emohaa創(chuàng)始人黃民烈表示:“希望未來的投資人能有社會(huì)情懷和前瞻性,能夠認(rèn)可AI+精神心理的賽道,愿意和公司一起耕耘,不急于短期變現(xiàn)?!?/p>
在各路情感機(jī)器人變現(xiàn)的道路上,玩家們都不著急。相比之下,他們更著急的是:“我的機(jī)器人什么時(shí)候能夠更‘善解人意’?”
03 情根尚淺
“善解人意”對(duì)于現(xiàn)階段的聊天機(jī)器人來說,還較為吃力,在搞懂“是什么”的問題上,還存在著較大挑戰(zhàn):
在《2021年中國智能客服滿意度調(diào)查報(bào)告》中顯示,僅有9.6%的用戶認(rèn)為,智能客服問題解決能力高于人工客服?;卮鹎宦?59.1%)、重復(fù)循環(huán)操作(50.6%)、答非所問(47.3%)等是用戶智能客服使用中遇到的主要問題。
也就是說,在底層技術(shù)上面,各家都要多下功夫。
在算力取決于硬件、算法基本開源的情況下,數(shù)據(jù)成為大施拳腳的地方,也是各家研究機(jī)構(gòu)和企業(yè)角力的核心。
但在搜集數(shù)據(jù)的過程中,困難重重。
首先要提及的便是數(shù)據(jù)標(biāo)注環(huán)節(jié)。這是因?yàn)椋辛藰?biāo)注數(shù)據(jù),算法才能在基礎(chǔ)上進(jìn)行訓(xùn)練,數(shù)據(jù)標(biāo)注的質(zhì)量越高,學(xué)習(xí)結(jié)果越精確,NLP邁入實(shí)用階段的可能性越大。
但很多企業(yè)在這個(gè)環(huán)節(jié)腦袋都大了——太費(fèi)事了。
一是數(shù)據(jù)標(biāo)注需要專業(yè)的人去做。據(jù)Emohaa背后團(tuán)隊(duì)透露,他們很多的標(biāo)注工作都是心理專業(yè)的學(xué)生、實(shí)習(xí)心理咨詢師、執(zhí)業(yè)心理咨詢師,和專業(yè)的心理咨詢機(jī)構(gòu)合作,如此導(dǎo)致標(biāo)注成本很昂貴。
二是一些領(lǐng)域的類別體系太過細(xì)致和復(fù)雜,AI很可能學(xué)不會(huì)。
在心理咨詢中情緒可以細(xì)分為32個(gè)類別,哪怕是聘請(qǐng)心理專業(yè)人士去標(biāo)注,標(biāo)簽太細(xì)也很難區(qū)分,不同人有不同的理解,又會(huì)讓數(shù)據(jù)標(biāo)注存在一致性問題。所以團(tuán)隊(duì)目前也只能從10類情緒的標(biāo)簽體系做起。
其次是在評(píng)價(jià)環(huán)節(jié),也不是誰都可以反饋。
評(píng)價(jià)環(huán)節(jié)一般是算法自動(dòng)評(píng)價(jià)和人工評(píng)價(jià)。算法自動(dòng)評(píng)價(jià)主要通過讓AI做一些測(cè)試題并評(píng)分,成本可以忽略不計(jì),但是人工評(píng)價(jià)就比較貴——例如黃民烈團(tuán)隊(duì)表示,要找很多匹配的用戶跟它聊天,然后根據(jù)交互情況,對(duì)結(jié)果進(jìn)行打分。這就需要大量的、特殊的、易于溝通的群體,必將耗時(shí)耗力耗錢。
而目前的產(chǎn)品形態(tài)大多都是多模態(tài)模型,無疑又增加了難度。
由于多模態(tài)數(shù)據(jù)蘊(yùn)含的信息更為復(fù)雜、模態(tài)間對(duì)齊較為困難等問題,導(dǎo)致多模態(tài)的數(shù)據(jù)標(biāo)注難度更大——人類較為復(fù)雜,文字、表情、語氣等信息很有可能表達(dá)的不是一個(gè)意思,機(jī)器人崩潰的概率很大。
在這樣的難度下,各家都表示,先培養(yǎng)信任,積累數(shù)據(jù)。
前微軟(亞洲)互聯(lián)網(wǎng)工程院副院長李笛表示,小冰一開始的目的就是為了積累數(shù)據(jù)——沒有做一個(gè) APP 讓用戶來下載,而是在各個(gè)地方刷存在感,如微博、微信等用戶密集陣地。
也是為了培養(yǎng)信任——人們會(huì)因?yàn)樵谀骋患虑樾湃我粋€(gè)人之后,很有可能各方面都信任他。當(dāng)各方面都信任這個(gè) AI 的情況下,它有一天給用戶推薦一件事情,用戶很有可能會(huì)去試試。
數(shù)據(jù)的積累、信任的培養(yǎng),是為了背后的框架
李笛表示,小冰能夠把數(shù)據(jù)和訓(xùn)練成果反饋給框架,從而推進(jìn)框架的技術(shù)發(fā)展。不是從流量中收錢。而是把框架里的技術(shù)拿出來去解決一些垂直領(lǐng)域的問題,例如在奧運(yùn)賽場(chǎng)上,小冰和冬奧會(huì)合作的高空自由滑雪項(xiàng)目裁判,是團(tuán)隊(duì)從框架里面積累出來的計(jì)算機(jī)視覺技術(shù)。
而AI大戶百度,也希望通過兩位情感機(jī)器人與用戶間的對(duì)話,得到用戶對(duì)AI回答準(zhǔn)確度的反饋(每一句話都有贊同和不贊同的標(biāo)識(shí)),從而優(yōu)化模型,為背后的框架注入新鮮的血液。
而這,先得花大量的營銷費(fèi)用+差異化的人設(shè),讓大家頻繁地和“葉悠悠”、“林開開”聊天,并且樂于給出自己的反饋。