文|烏鴉智能說
今年,被很多人看作是AI硬件的元年,很多公司發(fā)布了不少有趣的AI硬件,像AI Pin、Rabbit R1,但都有點高開低走的意思,評價最好的反而是只做AI+錄音機的Rewind Pendant。
可能是受到這個事情的啟發(fā),科技巨頭們開始紛紛盯上了另一種AI驅動的新設備——AI耳機。根據外媒報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機。而就在4月,字節(jié)跳動也收購了一家耳機公司。
相比AI Pin、Rabbit R1等AI硬件,AI耳機的好處在于,完全拋棄了顯示功能,在充分利用AI感知能力的同時,最大程度地優(yōu)化了便捷性,與手機形成了明顯的差異化。
畢竟,在光學顯示技術沒有革命性進步的前提下,足夠分辨率的顯示效果,就需要增加設備的體積,進而影響便捷性,以至于AI硬件很容易面臨靈魂拷問:既然都是要拿在手里,我為什么不用手機呢?
在所有人都幻想著下一代個人計算平臺的當下,主打便捷性的AI耳機,似乎成為AI硬件最容易突破的方向。
/ 01 / 科技巨頭扎堆AI耳機
這段時間,越來越多科技公司開始布局AI耳機。
據國外媒體報道,Meta平臺正在探索開發(fā)帶有攝像頭的人工智能耳機,希望這種設備能用來識別物體和翻譯外語。
Meta的首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)已經看過了該設備的幾種可能設計,但一名員工表示,他還沒有對任何設計感到滿意。目前尚不清楚最終設計將是入耳式耳機還是頭戴式耳機。這個項目在Meta內部被稱為“Camerabuds”。
OpenAI的CEO Sam Altman最近告訴一位合作伙伴,他和前蘋果首席設計師Jony Ive的設計公司LoveFrom已經探索了開發(fā)帶攝像頭的耳機設備。不僅如此,蘋果也在探索在其耳機中加入攝像頭和AI。
據國外媒體報道,電子產品公司Ear Micro的Bear Clark表示,科技公司對開發(fā)“可聽穿戴設備”的興趣在過去八到十個月里激增。Clark說,最近有兩家大型科技公司聯(lián)系他,希望開發(fā)智能耳機,盡管他拒絕透露這些公司的名稱。
除了自行研發(fā)外,科技巨頭們也在通過收購布局耳機市場。根據媒體報道,字節(jié)跳動已于4月份收購OWS公司Oladance品牌大十科技,收購價格在3-5億元之間,目前字節(jié)跳動團隊人員已經進駐大十科技。
收購Oladance或是字節(jié)推出AI眼鏡和AI手機的重要動作。據說創(chuàng)始人李浩乾將入職字節(jié)跳動,職級比大多類似的收購的CEO級別都要高,體現字節(jié)硬件的決心和戰(zhàn)略高度。
今年4月,由 Alphabet 旗下的神秘實驗室 Google X 孵化的Iyo,已經推出了一款AI 藍牙耳機Iyo One。
Iyo One 的外觀和交互沒有 Ai Pin 那么激進,就是一副體型更大的藍牙耳機,沒有屏幕,不搞手勢,不搞投影,不搞觸摸,專注于自然語言的語音交互。在應用場景上,創(chuàng)始人 Jason Rugolo 舉了一些例子,比如收到郵件或短信,不必拿出手機、滑動、打字,完全可以在坐著喝咖啡的時候,用耳朵接收信息。
至少從目前看,已經有Meta、OpenAI、字節(jié)跳動等多家科技大廠有意布局AI耳機。
/ 02 / 把便攜性拉到極致
為什么這么科技公司會選擇耳機?在我看來,主要有以下兩個原因:
第一,盡管新的計算平臺尚未誕生,但基于過去硬件發(fā)展的經驗,行業(yè)對下一代計算設備仍然有幾點共識:一個比手機更輕、更小、更便宜、更隨身的設備?;谶@幾點,眼鏡、耳機、項鏈、帽子等等一切可攜帶的物品,都被認為是可能的候選形態(tài)。
與AI Pin等AI硬件相比,AI耳機在便攜性方面有著天然優(yōu)勢。AI耳機基本完全拋棄了顯示這一交互方式,有利于最大程度放大便攜性優(yōu)勢。
根據怒喵科技CEO李楠的看法,光學顯示技術在三年內不會有革命性的進步,因此要想做到有足夠分辨率的顯示效果,就需要增加設備的體積,而這勢必會影響便攜性。而便攜性恰恰是AI硬件最重要的屬性。
第二,耳機這個品類過去幾年在場景化方面取得了重要的突破,變得越來越重要。
手機滲透生活的歷史,也是耳機技術變革的歷史。智能手機時代耳機的變革分成三個階段:音質驅動階段:耳機的主要改進聚焦在音質提升;場景驅動階段:分別面向開放場景和封閉場景兩個方向發(fā)展;體驗驅動階段:為了能夠長時間佩戴,出現了 OWS 開放式可穿戴耳機,分別向掛耳耳機和夾耳耳機兩個方向發(fā)展。
隨著手機中音頻、視頻內容占比的逐漸增加,人們對長時間佩戴耳機的需求越來越大。這標志著耳機從單一功能(僅用于聽音樂或打電話)的轉變?yōu)槎喙δ芷者m性產品,成為接收各類多媒體信息的設備。
也就是說,耳機已經能夠完成多媒體內容與日常信息交流的處理,是重要性、計算能力僅次于手機的第二大可攜帶計算設備。
基于以上兩點,在沒有新硬件形態(tài)的情況下,將便捷性拉到極致的耳機,似乎成為AI硬件最容易突破的方向。
/ 03 / 探索AI耳機的兩種思路
從目前看,AI耳機的探索大致有兩種思路:
AI耳機的第一種思路是AI+耳機,以耳機為硬件載體,通過更多交互方式,讓耳機成為下一個的個人計算中心,路徑有三:
一是,利用AI提升耳機的環(huán)境感知能力,不僅通過視覺感知環(huán)境,甚至加入視覺。比如,蘋果和Meta都在嘗試往耳機上面裝攝像頭。
根據彭博社爆料,蘋果從去年開始就研究帶有攝像頭的AirPods,代號為 “B798”。這款耳機的大小和現有AirPods幾乎相同,只不過內嵌了低分辨率攝像頭。攝像頭可以用來拍照,以及通過AI實現多個功能,為用戶的日常生活提供協(xié)助。
二是通過技術實現更好的交互體驗。比如,GPT-4o把語音交互的延遲從2s降低到300ms,還給了極其豐富的音色表現力。
不久前,華盛頓大學也研發(fā)了一款名為Target Speech Hearing(TSH)的人工智能耳機系統(tǒng),它能夠通過佩戴者的注視來“鎖定”目標說話者,過濾掉環(huán)境中的其他聲音。
佩戴者只需將頭部對準目標說話者,注視3-5秒鐘后,輕按一個按鈕,系統(tǒng)便會開始捕捉并分析該說話者的聲音特征。此后,無論佩戴者如何移動,系統(tǒng)都會持續(xù)播放被“鎖定”的說話者的聲音,實現個性化的聽覺體驗。
三是基于更強的計算能力,提供更多的語音功能。比如,Iyo One 正式發(fā)布時,預計將有消息、電話、導航、音樂播放等語音功能,動動嘴巴就能回消息。
AI耳機的另一種思路是往現有耳機里增加AI功能,在原有的基礎上,利用AI技術補充一些功能,提供新的體驗。
比如,研發(fā)翻譯軟硬件產品的深圳公司 Wooask,推出了結合 ChatGPT 的新款觸屏耳機 TransBuds A8,支持實時翻譯 144 種語言,聲音傳到耳朵,文字則顯示在屏幕。
消費電子品牌 Nothing 也是這個思路,升級現有設備,而不是通過新的硬件重新發(fā)明輪子。
今年 4 月,Nothing 宣布,在 Nothing 手機安裝了最新 Nothing OS 和 ChatGPT 的用戶,可以直接通過 Nothing 耳機與 ChatGPT 對話,聯(lián)網后捏住耳機便能激活,捏住耳機就能和 AI 對話、問問題。
相比于后者,前者的路線無疑更加興奮。尤其當所有人都沉浸在AI創(chuàng)造下一個計算平臺的敘事里,AI耳機無疑為我們帶來了更多的可能性。