文 | 定焦One 王璐
編輯 | 魏佳
有這樣一款眼鏡,讓你無論身處英國、法國還是意大利,都不用擔心語言不通,它能將對方說的任何語言實時翻譯成你熟悉的文字,甚至連你目之所及的廣告牌,也能直接將翻譯顯示在鏡片上。
不僅是貼身翻譯,它還能實時拍照、錄制視頻,再也不用擔心滑雪、騎馬、駕駛時不方便記錄;如果想聽歌或者去某個地方,只需喊一聲“Hey XX”,便能喚起音樂、導航功能。總之,手機上的操作幾乎都能在這款眼鏡中實現(xiàn)。
而且它不笨重,外觀和墨鏡差不多,重量僅比普通墨鏡多十克左右,售價在2000元上下。
這款黑科技便是國內(nèi)大廠都在搶著做的AI眼鏡。
這股風從國外的Meta吹來。去年,Meta與百年眼鏡老店雷朋聯(lián)合推出了一款名叫「Ray-Ban Meta」的智能眼鏡(以下簡稱Meta眼鏡),今年4月又新增了AI功能,立刻受到追捧。據(jù)科技媒體The Verge統(tǒng)計,截至2024年5月,這款智能眼鏡的全球銷量已突破100萬副。此前,沒有任何一款智能眼鏡有過如此高的銷量。
這樣的爆款效應讓很多人意識到,AI眼鏡或是現(xiàn)階段AI最佳的落地場景。
于是從今年4月底開始,華為、百度等各大廠商陸續(xù)發(fā)布/發(fā)售了AI眼鏡,這股風潮更是在11月到達了頂峰,有媒體統(tǒng)計,最密集時,國內(nèi)外僅10天就發(fā)布了18副AI眼鏡。
入局者中,既包括互聯(lián)網(wǎng)大廠(百度、字節(jié))、消費電子企業(yè)(華為、小米、OPPO、TCL),還有AR類智能硬件科技公司(Rokid、閃極科技、影目科技等),它們或多或少在自研大模型、硬件設備、銷售渠道等方面具備一到多個優(yōu)勢,而且這些AR類公司大多有大廠/消費電子企業(yè)的投資或合作。
研究機構wellsenn XR預測,從2025年開始,AI智能眼鏡將在傳統(tǒng)眼鏡銷量保持穩(wěn)定增長的大背景下快速滲透,2029年,AI智能眼鏡年銷量有望達到5500萬副,到2035年,有望達14億副。
如今的“百鏡大戰(zhàn)”,堪比去年的“百模大戰(zhàn)”,入局者還在不斷增多,做FA的王立表示,“AI眼鏡是投資機構積極在看的少數(shù)熱門AI賽道。”
但任何火熱的賽道都可能面臨一定的風險,況且各家之前也給AI尋找過包含耳機在內(nèi)的多種硬件設備做為載體,都沒有到達預想效果,這次選擇難度更高的眼鏡,能成功嗎?
火熱的AI眼鏡:三類公司,三種路線
據(jù)「定焦One」梳理,目前入局AI眼鏡的公司可以分為三類,它們的產(chǎn)品及主要信息如下表:
注:僅統(tǒng)計確定發(fā)布日期的產(chǎn)品
在對比這些公司的產(chǎn)品之前,我們先簡單科普一下,國內(nèi)AI眼鏡的基本功能包括語音識別、音視頻播放錄制和AI調(diào)用(比如語音交互、翻譯、查詢天氣交通信息)。綜合多位從業(yè)者的觀點,廠商大部分都是圍繞著“音頻”、“攝像頭”、“AR顯示”三種要素進行組合,價格在500元-5000元之間,功能越多,價格越高,具體可以主要分為三種路線。
第一種主打音頻,沒有攝像頭、功能較為單一,只能支持語音通話、聽音樂等音頻功能,比如小米生態(tài)鏈企業(yè)蜂巢科技推出的界環(huán)AI音頻眼鏡、華為推出的華為智能眼鏡2等。由于無法支持拍照、錄像、視頻顯示,也有人將這類AI眼鏡定義為音頻眼鏡。
最近,「定焦One」走訪了華為某門店,由于AI眼鏡行業(yè)的火熱,不少顧客對店內(nèi)在售的華為智能2眼鏡表示好奇,但得知它只能支持音頻功能時,便沒了興趣。一名工作人員更是將這款眼鏡形容為“眼鏡款式的藍牙耳機”。
北京某商場展示的華為智能眼鏡2(共五款,價格在1699-2299元不等) 「定焦One」攝
第二種是音頻+攝像頭,在音頻的基礎上具備了拍照、錄像等視頻功能,今年大火的Meta眼鏡,以及百度的小度AI眼鏡就是走的這個路線。
第三種是音頻+攝像頭+AR(增強現(xiàn)實),不僅支持音視頻,還具備增強現(xiàn)實功能,例如,用戶在拍完照后,可直接在眼鏡上看預覽,AR眼鏡公司Rokid推出的Rokid Glasses屬于這類。
我們再舉個例子區(qū)別第二種和第三種,比如你在國外看到了一個外文廣告牌,搭載AR顯示的AI眼鏡可通過攝像頭拍照識別廣告牌內(nèi)容,并翻譯成中文顯示在眼鏡上,而沒有AR顯示的AI眼鏡,只能將翻譯結(jié)果通過音頻輸出或者支持用戶在手機上查看。
另外,這三種路線的產(chǎn)品都能夠調(diào)用AI實現(xiàn)互動,也都能搭載大模型,有些是靠自研,有些是采用第三方合作伙伴的技術。
從技術難度上來說,第一種比較低,國內(nèi)的AI音頻眼鏡已經(jīng)推出了一段時間,也有了面向市場的代表性產(chǎn)品,第二種和第三種對技術的要求更高。具體來說,第一種主要依賴語音和TTS(文本轉(zhuǎn)語音)交互,后兩者是圖像交互,在語音、TTS的基礎上還加入了顯示,且顯示的使用率更高,而帶AR顯示的,還需要具備增強現(xiàn)實技術。也因此,絕大多數(shù)這類型的AI眼鏡還處在研發(fā)或者“發(fā)布不發(fā)售”狀態(tài)。
相應的,在硬件成本上,也是第一種比較低,只需要在鏡框里加上麥克風陣列、耳機、電池和處理器等,第二種需要加上攝像頭,搭載AR的第三種還需要光學模塊。配件多了的同時,還需要解決更高的功耗和散熱問題。
目前入局的互聯(lián)網(wǎng)大廠、消費電子企業(yè)、AR公司,主要發(fā)力的是后兩種,它們做AI眼鏡的目的也不太一樣。
從業(yè)者小明告訴「定焦One」,百度、字節(jié)這些互聯(lián)網(wǎng)大廠,目前做的是第二種,更多是想通過AI眼鏡跑自己的大模型,而非主要靠賣硬件,相比消費電子企業(yè)和AR類公司,它們在硬件上也不具備競爭優(yōu)勢。AR類公司之前也做眼鏡,現(xiàn)在是想通過與AI結(jié)合,找到更多業(yè)務增量。至于小米這類消費電子企業(yè),在產(chǎn)品上跟風Meta,并通過供應鏈優(yōu)勢壓低價格,特別是小米在智能家居和物聯(lián)網(wǎng)上還具備優(yōu)勢,做AI眼鏡有一定想象空間。
期待中的AI眼鏡,和現(xiàn)實中的AI眼鏡
目前,各家在音視頻功能上已經(jīng)做得比較完善。
比如在語音喚醒和交互功能上,用戶可以用聲音輕松喚出“XX同學”等進行對話,或是進行音樂播放、天氣播報、信息推送。
各大廠商還將導航、翻譯、提詞器、速記整理等各種細化功能接入到AI眼鏡上,實現(xiàn)讓用戶不用費勁在手機里挨個打開,只需要簡單發(fā)出語音指令便能輕松完成。
視頻方面,也能實現(xiàn)比較高的拍攝錄像質(zhì)量。
比如Meta智能眼鏡搭載了1200萬像素的超廣角攝像頭(和iPhone11、12差不多),最長錄制時間三分鐘,國內(nèi)直接在這方面卷了起來,小度AI眼鏡配備了1600萬像素的超廣角攝像頭,Rokid Glasses在攝影時長上能達到40分鐘,幾家都具備防抖功能。
現(xiàn)階段,各家企業(yè)真正在比拼的,集中在三點。
首先是重量,要先解決用戶佩戴舒適度的問題。普通眼鏡的重量在三四十克,在此前已經(jīng)面市的VR、AR、MR眼鏡中,即便是相對較輕的AR眼鏡,大部分也在100g以內(nèi),難以長時間佩戴,也影響著產(chǎn)品的普及。
因此,這一批AI眼鏡廠商非常重視造型設計與舒適度,即在保持一定續(xù)航能力的前提下,將AI眼鏡做到輕量化和小型化。
由于AI眼鏡要加入芯片、主板、電池等元器件,目前大多數(shù)AI智能眼鏡的重量在五十克左右,為了讓AI眼鏡的重量無限趨近于普通眼鏡,廠商想出了各種方法。
比如魅族推出的StarVAir2采用了超小體積的單綠光引擎,體積縮小50%,重量減輕50%,Rokid將左右鏡片上各安裝一個光機的雙光機方案,精簡為鼻梁中間單光機雙鏡片顯示方案,進一步降低重量。
圖源 / 星紀魅族科技微博
其次是智能體驗,AI眼鏡最大的噱頭莫過于AI。
用戶對AI眼鏡的期待是,希望它能超過手機,像人體感官一樣完美捕捉視覺、聲音、位置等信息,從而提供貼心智能服務,但目前AI眼鏡和大模型的結(jié)合程度,還達不到完全智能化的水平,導致其能實現(xiàn)的功能都比較基礎,例如語音助手、實時翻譯、導航提醒、物體識別等,甚至在捕捉信息的靈敏度和準確度等方面,都還有很大提升空間。
即便是被大家認可的Meta眼鏡也存在很多bug,比如在聲音上,Meta眼鏡內(nèi)置了5個麥克風陣列系統(tǒng),揚聲器也調(diào)大了音量,但在嘈雜環(huán)境中還是會受到影響;面對較為復雜的內(nèi)容回復,其也不會直接念出來,而是提示用戶在手機上查看。所以一些用戶對Meta眼鏡的主要定位是,充當耳機、相機、備忘錄,使用場景有限。
而且“和國外相比,國內(nèi)大模型和國外的GPT-4o還存在一定差距,信息檢索能力和反饋速度等方面都存在不同程度的短板,大多數(shù)AI眼鏡還沒能達到讓消費者買單的程度。”小明表示。
最為關鍵的一點是,目前AI眼鏡還不能脫離手機使用。
小明告訴「定焦One」,AI眼鏡本質(zhì)上是硬件部分+大模型,用戶通過眼鏡識別到圖像或語音信息,然后通過Bluetooth、Wifi等傳遞給手機扔到云端處理,再反饋到眼鏡上,國內(nèi)AI眼鏡本身里面跑的是Linux系統(tǒng),而非智能安卓,AI功能的實現(xiàn)需要借助手機。
換句話說,如果手機不在身旁,AI眼鏡便不具備高度智能化。
續(xù)航也是用戶擔心的一大問題。
目前,Meta眼鏡只支持三分鐘的視頻錄制,有用戶表示,如果重復啟動連續(xù)拍攝視頻,電量最多只能支撐半小時,即便不錄制視頻,電量也撐不過半天,這離設想中的長時間佩戴還存在差距。
不過很多國內(nèi)廠商似乎已經(jīng)找到了解決方案,Rokid Glasses官方表示,在明年發(fā)售時,續(xù)航能達到4個小時,并配有充電眼鏡盒,20分鐘充滿電。小度AI眼鏡也宣稱能連續(xù)聽歌或打電話5小時以上。但這些,都還要等到產(chǎn)品正式發(fā)售后才能見分曉。
AI眼鏡真正爆發(fā),還需要耐心
盡管現(xiàn)實中的AI眼鏡離想象中的差距不小,但并不影響從業(yè)者和投資人的熱情,他們認為,明年會出現(xiàn)“百鏡大戰(zhàn)”。
綜合從業(yè)者、投資人的說法,大家看好AI眼鏡,主要在于三方面。
王立看好的是眼鏡本身具備的入口優(yōu)勢。
他解釋,現(xiàn)在用戶最主要的消費電子產(chǎn)品是手機,而AI 眼鏡被認為是最有可能切割手機10%-20%使用時長和功能,并能與虛擬世界產(chǎn)生交互的終端形態(tài),能安裝麥克風、揚聲器、攝像頭、WiFi/藍牙模塊等硬件,從而進行音頻識別、視頻拍攝、無線通訊、翻譯、導航等功能,而且通過視覺進行AI問答、物體識別,效率和精確性也高于純語音。
“目前,AI眼鏡是AI所有硬件產(chǎn)品里天花板最高的賽道,也是投資機構積極在看的少數(shù)AI熱門賽道。”王立表示。
國外已有成功的AI眼鏡案例,也給了大家很大信心。
在交流中,不止一位從業(yè)者提到了Meta眼鏡的高銷量。國金證券曾估算,2024年Meta眼鏡出貨量或達200萬臺,而且考慮到目前AI功能僅限美國和加拿大用戶使用,若未來區(qū)域、語言推廣至全球,對應銷量或超600萬臺。
王立認為,Meta眼鏡的銷量已經(jīng)證明了用戶對這一賽道存在需求,相比其他AI硬件,AI眼鏡跑通了從0到1。
AI眼鏡硬件供應鏈完善,智能體趨于成熟,也是它被看好的重要原因。
從業(yè)者黃先生告訴「定焦One」,拿比較復雜的音攝顯(音頻+攝像頭+AR)組合的AI眼鏡來說,其涉及的比較重要的光機技術,供應鏈已逐漸完善,達到了商業(yè)化程度,應用端也迎來了智能體的爆發(fā)。這一方面降低了成本,AI+AR眼鏡的售價大多能控制在2500元左右,另一方面也有了豐富的應用供給,能實現(xiàn)各類功能。
圖源 / LAWK李未可微博
不過,AI眼鏡目前還處于早期,國內(nèi)還沒有爆款誕生,行業(yè)也存在著一些不確定因素。
首先是市場競爭激烈,但產(chǎn)品差異化不明顯。
不止一位從業(yè)者表示,即便各家分屬于不同領域,但對AI眼鏡的認知上沒有太大差距,都是在模仿Meta,而且參與競爭的廠商越多,容錯率越低。
王立表示,投資人在選擇一家AI眼鏡公司時,更關注能不能做出差異化產(chǎn)品,具體看團隊對用戶的理解度和技術能力,比如是否了解消費者對AI眼鏡的功能需求、價格接受區(qū)間、眼鏡外觀等,以及團隊是否具備這些需求的研發(fā)能力。此外渠道也很重要,Meta眼鏡能成功的一個重要原因是選擇與雷朋合作,其生產(chǎn)供應渠道非常完善。
其次,攝像頭既是AI眼鏡重要的一環(huán),也是困擾著從業(yè)者的敏感點。
為了更加了解用戶對AI眼鏡的需求,有部分從業(yè)者在做用戶調(diào)查發(fā)現(xiàn),攝像頭功能可能會侵犯個人隱私,降低大家對AI眼鏡的接受度。
“在日常聚會或工作會談中,如果對方一直帶著一副有攝像頭的眼鏡,就像架了一臺攝像機,大多數(shù)用戶都會覺得別扭,產(chǎn)生戒備心,害怕被拍攝或者錄下來。”從業(yè)者程成表示。
為了解決這一問題,Meta 想到的解決辦法是,加了一個顯示提醒,當攝像頭開啟時,眼鏡會亮燈,但程成表示,在實際操作時,用戶可以通過很多物理和技術手段將這一提示關掉。
總結(jié)來看,AI眼鏡雖然入局者眾多,Meta眼鏡的銷量也證明了市場接受度,但這個行業(yè)真正爆發(fā)還需要時間。究竟誰能夠復制Meta的成功,要等到明年產(chǎn)品大規(guī)模上市后才能揭曉。
應受訪者要求,文中王立、小明、程成為化名。