文 | 硅兔賽跑 Lexie
編輯|Lu
在關(guān)于AI的大討論中,人們?yōu)槠滟x予的角色要么是我們最得力的高效助手,要么則是將顛覆我們的“機器軍團”,不管是敵是友, AI不僅要能完成人類布置的任務,還要能“讀懂”人心,而這一讀心能力也正是今年以來AI領域的重頭戲。
在PitchBook今年發(fā)布的企業(yè)Saas新興技術(shù)研究報告中,「情感AI」成為了一大技術(shù)亮點,它指的是使用情感計算和人工智能技術(shù)來感知、了解和進行對人類情感的互動,試圖通過分析文字、面部表情、聲音和其他生理信號來理解人類的情緒,簡單來說,情感AI就是希望機器能像人類一樣,甚至比人類更好地“讀懂”情感。
它的主要技術(shù)包括:
面部表情分析:通過攝像頭、計算機視覺和深度學習,檢測微表情與面部肌肉運動。
聲音分析:通過聲紋、語調(diào)、節(jié)奏識別情緒狀態(tài)。
文本分析:借助自然語言處理(NLP)技術(shù)解讀語句和上下文。
生理信號監(jiān)測:使用可穿戴設備分析心率、皮膚反應等,提升互動個性化和情感豐富度。
Emotion AI
情感AI的前身是情感分析技術(shù),它主要是通過文本互動進行分析,比如在社交媒體上通過文字進行用戶情感的分析和提取,而有了AI的加持,整合視覺和音頻等多種輸入方式,情感AI承諾著更加精準和完整的情感分析。
01 VC撒錢,創(chuàng)企獲巨額融資
硅兔君觀察,情感AI的潛力吸引了眾多投資者的關(guān)注,一些專注于這個領域的初創(chuàng)公司像Uniphore、MorphCast等,已經(jīng)在這一賽道上獲得了大量投資。
來自加州的Uniphore從2008年起就在探索為企業(yè)提供自動化對話解決方案,已經(jīng)開發(fā)出包括U-Self Serve、U-Assist、U-Capture和U-Analyze等多個產(chǎn)品線,幫助客戶通過語音、文本、視覺和情感AI技術(shù)進行更加個性化和情感豐富的互動。U-Self Serve主打精準識別對話中的情感和語氣,讓企業(yè)能夠提供更加個性化的服務,來提升用戶參與滿意度;
U-Self Serve
U-Assist則能通過實時指導和工作流程的自動化來提高客服代理的工作效率;U-Capture可以通過自動化的情感數(shù)據(jù)收集和分析,讓企業(yè)擁有對客戶需求和滿意度的深度洞察;而U-Analyze則能夠幫助客戶識別互動中的關(guān)鍵趨勢和情感變化,提供由數(shù)據(jù)驅(qū)動的決策支持來增強品牌忠誠度。
Uniphore的技術(shù)并不僅僅是讓機器理解語言,而是希望它們能在與人類互動時,捕捉和解讀隱藏在語氣、表情背后的情感。這種能力讓企業(yè)在與客戶互動時,不再只是機械化應對,而是能夠更好地滿足客戶的情感需求,通過使用Uniphore, 企業(yè)的用戶滿意度能夠達到87%,客服表現(xiàn)提升30%。
Uniphore至今已經(jīng)完成了超6.2億美元融資,最近一輪投資來自于2022年由NEA領投的4億美元,March Capital等現(xiàn)有的投資者也進行了參投,此輪后估值達到了25億美元。
Uniphore
Hume AI則推出了世界上第一個能夠共情的語音AI,由前Google科學家Alan Cowen創(chuàng)立,他曾以開創(chuàng)了語義空間理論而出名,這一理論通過揭示聲音、面部和手勢的細微差別,來理解情緒體驗和表達,Cowen的研究成果發(fā)表在“自然“和“認知科學趨勢”等眾多期刊上,涉及迄今為止研究范圍最廣、最多樣化的情緒樣本。
以此研究驅(qū)動的Hume開發(fā)出了對話式語音 API - EVI,它結(jié)合了大型語言模型和同理心算法,能夠深入理解和解析人類的情感狀態(tài),它不但能識別語音中的情感,還能在與用戶的互動中做出更加細膩和個性化的反應,而開發(fā)人員只需幾行代碼即可使用這些功能,并可將其內(nèi)置到任何應用程序中。
Hume AI
當前大多數(shù)AI系統(tǒng)的主要限制之一在于它的指令主要由人類給出,這些指令和提示容易出錯且無法挖掘出人工智能的巨大潛力,而Hume所開發(fā)出的共情大型語言模型 (eLLM) 能夠根據(jù)上下文和用戶的情緒表達調(diào)整其使用的詞語和語調(diào),通過將人類快樂作為第一原則進行機器的學習、調(diào)整和互動,在心理健康、教育培訓、急救呼叫、品牌分析等多個場景中都能為用戶帶來更加自然和真實的體驗。
就在今年3月,Hume AI 完成了由EQT Ventures領投的5000萬美元B輪融資,投資方還包括Union Square Ventures、Nat Friedman &Daniel Gross、Metaplanet和Northwell Holdings等機構(gòu)。
在這一領域的還有專門衡量消費者認知和情感反應的Entropik,通過 Decode這一融合了情感AI、行為AI、生成AI和預測AI綜合力量的功能,它能夠更好了解消費者的行為和偏好,從而提供更個性化的營銷建議,Entropik最近在2023年2月完成了2500萬美元的B輪融資,投資方包括SIG Venture Capital和Bessemer Venture Partners。
Entropik
02 巨頭參與,一片混戰(zhàn)
科技大廠憑借自身優(yōu)勢,在情感AI這一領域也有所布局。
包括 Microsoft Azure認知服務的情感API,能夠通過分析面部表情和情緒,來識別圖片和視頻中的喜悅、憤怒、悲傷、驚訝等多種情緒;
IBM Watson的自然語言理解API可以處理大量文本數(shù)據(jù),識別出背后的情感傾向(如積極、消極或中性),來更精準的解讀用戶意圖;
Google Cloud AI 的 Cloud Vision API 擁有強大的圖像分析功能,能夠快速識別圖片中的情緒表達,且支持文字識別和情緒關(guān)聯(lián);
AWS 的 Rekognition也能夠檢測情緒、識別面部特征并追蹤表情變化,還可以與其他AWS服務結(jié)合使用,成為完整的社媒分析或情感AI驅(qū)動的營銷應用。
Cloud Vision API
有些初創(chuàng)公司在情感AI領域的研發(fā)腳步更快,甚至到了科技巨頭都要“挖人”的地步,比如獨角獸Inflection AI就被投資方微軟看中了AI團隊和模型,微軟在與Bill Gates、Eric Schmidt和NVIDIA等多方共同為Inflection AI投下了13億美元后,向AI領軍人物也是Inflection AI的聯(lián)合創(chuàng)立者之一Mustafa Suleyman拋出橄欖枝,隨后Suleyman連帶70多位員工轉(zhuǎn)投微軟,而微軟也為此支付了近6.5億美元。
不過,Inflection AI也很快重整旗鼓,組建了來自擁有谷歌翻譯、 AI咨詢和AR 多個背景的新團隊,繼續(xù)在其核心產(chǎn)品Pi上持續(xù)發(fā)力。Pi是一款能夠理解并回應用戶情感的個人助手,與傳統(tǒng)的AI不同,Pi 更加注重與用戶建立情感連接,通過分析語音、文字等輸入感知情緒,在對話中展現(xiàn)出同理心。Inflection AI將Pi視為教練、知己、傾聽者和創(chuàng)意伙伴,而不是簡單的AI助手。此外,Pi 擁有強大的記憶功能,能夠記住用戶的多次對話歷史,以此來提升互動的連續(xù)性和個性化體驗。
Inflection AI Pi
03 發(fā)展之路,關(guān)注和質(zhì)疑并存
雖然情感AI寄托著我們對更加人性化互動方式的期許,但就像所有的AI技術(shù)一樣,它的推廣更伴隨著關(guān)注和質(zhì)疑。首先,情感AI是否真的能夠準確解讀人類的情感?在理論上,這項技術(shù)的確能夠使服務、設備和技術(shù)的體驗更加豐富,但從現(xiàn)實的角度來看,人類的情感本質(zhì)上是模糊和主觀的,早在2019年就有研究人員曾對這項技術(shù)提出質(zhì)疑,表示面部表情并不能可靠的反映人類的真實情感,因此單純依賴機器來模擬人類的面部表情、體態(tài)和語調(diào)來理解情感, 存在著一定的局限性。
其次,嚴格的法規(guī)監(jiān)管也一直是AI發(fā)展路上的絆腳石,比如歐盟的AI法案禁止在類似教育等領域使用使用計算機視覺情感檢測系統(tǒng),因此可能會限制某些情感AI解決方案的推廣;像是美國伊利諾伊等州也有法律禁止在未獲許可的情況下進行生物識別數(shù)據(jù)的收集,這就直接限制了情感AI某些技術(shù)使用的前提。同時,數(shù)據(jù)隱私和保護更是一個重要問題,情感AI通常應用于教育、健康、保險等對數(shù)據(jù)隱私要求格外嚴格的領域,因此確保情感數(shù)據(jù)的安全和合法使用,是每一家情感AI公司都需要面對的課題。
最后,不同文化地域的人與人之間進行交流和情緒解讀都是難題,對AI來說更是考驗,比如不同地區(qū)對情感的理解和表達方式各不相同,這可能影響情感AI系統(tǒng)的有效性和完整性,此外,情感AI在處理種族、性別和性別認同偏見時,也可能面臨不小的困難。
情感AI不僅承諾著減少人力的高效,還有著讀人心的體貼,但它是否能夠真的成為人類互動中的萬能解決方案,還是會成為和Siri大同小異的智能助手,在需要真正情感理解的任務中表現(xiàn)平平?或許在未來,AI的“讀心術(shù)”將會顛覆人機甚至是人類互動,但至少在現(xiàn)在,真正理解和回應人類情感,或許還是更需要人的參與和審慎。
參考來源:
Uniphore Announces $400 Million Series E(Uniphore)
Hume AI Announces $50 Million Fundraise and Empathic Voice Interface(Yahoo Finance)
Introducing Pi, Your Personal AI(Inflection AI)
‘Emotion AI’ may be the next trend for business software, and that could be problematic(TechCrunch)
EMERGING TECH RESEARCH Enterprise Saas Report (PitchBook)