文|科技新知 林書
編輯丨蕨影
回望2024年,一眾手機(jī)廠商諸如蘋果、榮耀等,都試圖在AI手機(jī)賽道闖出一條路來(lái)。然而,時(shí)至今日,又有多少?gòu)S商交出了令人滿意的答卷呢?
就在上周,華為發(fā)布了最新Mate70系列,特別在AI影像、隱私保護(hù)和智能交互上進(jìn)行了重大升級(jí)。尤其是在AI方面,華為通過推出AI動(dòng)態(tài)照片、隔空傳送、智能降噪等九大功能,試圖展示其在智能技術(shù)領(lǐng)域的持續(xù)投入。
然而,仔細(xì)審視這些創(chuàng)新,不難發(fā)現(xiàn),它們本質(zhì)上仍然是現(xiàn)有技術(shù)框架下的漸進(jìn)式改良,而非真正意義上的顛覆性突破。例如最被其稱道的AI隔空傳送功能,本質(zhì)上不過是對(duì)已有手勢(shì)識(shí)別技術(shù)的重新包裝。
從技術(shù)上來(lái)說,它所依賴的不過是手機(jī)前置攝像頭的感知能力,配合基礎(chǔ)的計(jì)算機(jī)視覺算法,實(shí)現(xiàn)簡(jiǎn)單的手勢(shì)追蹤和識(shí)別。這種技術(shù)在三星、小米等品牌早已有過嘗試,只不過都因?yàn)榻换ンw驗(yàn)不夠自然而逐漸被市場(chǎng)遺忘。
至于備受關(guān)注的"僅你可見"功能,其核心技術(shù)不過是基于面部識(shí)別的視線追蹤算法。這項(xiàng)技術(shù)在PC領(lǐng)域早已存在多年,如今不過是被移植到了手機(jī)端。況且,其實(shí)際使用中的局限性顯而易見:它要求用戶必須保持特定的觀看角度和距離,稍有偏離就會(huì)影響識(shí)別效果。
除此之外,此次發(fā)布會(huì)上Mate70展示的其他AI功能,例如AI通話總結(jié)、AI修改照片等,更是一些已經(jīng)司空見慣的“標(biāo)配技術(shù)”,總體上看并無(wú)太多新意可言。
這些所謂的AI創(chuàng)新,更像是華為在缺乏實(shí)質(zhì)性AI突破的情況下,不得不推出的一些表面功夫。在真正的AI革命面前,這些功能不過是浮于表面的點(diǎn)綴。
不過,實(shí)事求是地說,這樣的“創(chuàng)新疲態(tài)”,并不僅僅發(fā)生在華為一家大廠身上。
AI手機(jī)的尷尬現(xiàn)實(shí)
事實(shí)上,這一年的AI手機(jī)賽道,更像是一場(chǎng)平平無(wú)奇的技術(shù)秀。
蘋果的iOS 18雖然大肆宣傳"Apple Intelligence",但除了少部分跨應(yīng)用級(jí)的AI調(diào)用功能外,其他大部分能力,不過是將ChatGPT等現(xiàn)成技術(shù)稍作包裝,缺乏根本性的技術(shù)突破。
而榮耀在2024年MWC(世界移動(dòng)通信大會(huì))上,也重點(diǎn)展示了AI領(lǐng)域的新技術(shù)突破,特別是在Agent等方面的技術(shù)進(jìn)展。
從總體上看,其Agent技術(shù)展現(xiàn)出的自動(dòng)化能力,確實(shí)帶給了人們一種“手機(jī)即將邁入自動(dòng)駕駛”時(shí)代的想象。
但平心而論,這樣的想象背后,卻藏著兩點(diǎn)難以忽視的隱憂。
例如,在一鍵點(diǎn)咖啡的場(chǎng)景中,當(dāng)用戶瀏覽相關(guān)信息或下達(dá)語(yǔ)音指令時(shí),手機(jī)Agent就會(huì)直接識(shí)別意圖,聯(lián)動(dòng)相關(guān)的外部應(yīng)用(如支付、地圖、訂餐等),快速完成訂單生成和支付流程。
同樣地,面對(duì)“關(guān)閉APP自動(dòng)續(xù)費(fèi)功能”這樣的請(qǐng)求,榮耀的AI Agent也能自動(dòng)操作,找到所有開通APP自動(dòng)續(xù)費(fèi)服務(wù)的項(xiàng)目,并詢問用戶是否要取消。
但站在用戶的角度來(lái)看,這樣的“便捷”是否真的是一種直戳痛點(diǎn)的改進(jìn)?
在手機(jī)這塊方寸之間的屏幕上,各類APP的操作,實(shí)際上已經(jīng)簡(jiǎn)化到了一個(gè)接近閾值的狀態(tài),對(duì)普通消費(fèi)者來(lái)說,點(diǎn)咖啡這些任務(wù),本身并不耗費(fèi)太多精力,現(xiàn)有的手動(dòng)操作方式已經(jīng)足夠便捷。在此基礎(chǔ)上加入自動(dòng)化功能,邊際效益不但不高,甚至有可能適得其反。
因?yàn)樽詣?dòng)化功能的加入,雖然看似高效,卻可能讓一些用戶感到學(xué)習(xí)和適應(yīng)成本過高。
舉例來(lái)說,目前榮耀AI Agent 的啟動(dòng)方式,主要是依賴語(yǔ)音交互,但站在用戶體驗(yàn)的角度看,這仍是一種被動(dòng)的,需要有意識(shí)地使用的功能。以點(diǎn)咖啡這個(gè)場(chǎng)景為例,每當(dāng)用戶想下單時(shí),都需要被動(dòng)地用語(yǔ)音告訴手機(jī):“我想點(diǎn)XX味的咖啡,要XX杯。”
既然都是被動(dòng),這和用戶自己用手指多花幾十秒操作,又有多大區(qū)別?況且,一個(gè)很影響體驗(yàn)地方是:在公共場(chǎng)合,或其他不便于語(yǔ)音交互的嘈雜場(chǎng)景,這樣的互動(dòng)方式,多少會(huì)讓人覺得不自在。
此外,雖然Agent系統(tǒng)的主動(dòng)操作功能,強(qiáng)調(diào)安全性和隱私保護(hù),但手機(jī) Agent在任務(wù)自動(dòng)化過程中,總是需要訪問用戶的個(gè)人數(shù)據(jù),包括聯(lián)系人、位置信息,甚至是各類APP的登錄密碼等。
要避免這樣的隱私問題,Agent 系統(tǒng)只能在執(zhí)行任務(wù)時(shí),一次次地請(qǐng)求用戶“授權(quán)”“確認(rèn)”(例如其關(guān)閉自動(dòng)扣款的功能),如此一來(lái),便會(huì)不可避免地造成體驗(yàn)割裂的現(xiàn)象。
既然對(duì)用戶的“擾動(dòng)”如此頻繁,那所謂自動(dòng)化的意義究竟何在?
對(duì)于這點(diǎn),前蘋果設(shè)計(jì)主管 Jony Ive 認(rèn)為,AI Agent最大的價(jià)值不是取代用戶操作,而是創(chuàng)造更自然、更符合人類直覺的交互方式。言外之意,真正的創(chuàng)新在于讓技術(shù)變得“無(wú)形”。
昂貴的AI軍備競(jìng)賽
Jony Ive 最近與 OpenAI 合作開發(fā)新一代AI設(shè)備時(shí)提出:“我們需要重新思考人機(jī)交互的本質(zhì)。AI不應(yīng)該是一個(gè)需要學(xué)習(xí)使用的工具,而應(yīng)該像空氣一樣自然存在?!?/p>
對(duì)此,Jony Ive提出了關(guān)于“無(wú)形”設(shè)計(jì)理念的三個(gè)核心觀點(diǎn):
一是自然交互,當(dāng)技術(shù)真正成功時(shí),它應(yīng)該消失在背景中。就像我們不會(huì)意識(shí)到空氣的存在一樣,最好的AI交互應(yīng)該是無(wú)需思考的;二是情境感知,AI Agent不是簡(jiǎn)單的命令執(zhí)行器,而是要理解用戶的情境和意圖。它應(yīng)該在適當(dāng)?shù)臅r(shí)候提供幫助,而不是打擾用戶的思維流;三是人性化設(shè)計(jì),技術(shù)應(yīng)該適應(yīng)人類,而不是要求人類適應(yīng)技術(shù)。
簡(jiǎn)而言之,Jony Ive認(rèn)為,AI應(yīng)該更多地充當(dāng)一個(gè)“預(yù)判者”的角色,在用戶產(chǎn)生需求之前就完成準(zhǔn)備,而不是被動(dòng)地等待用戶的指令。
舉個(gè)例子,想象你正在開車,手機(jī)通過多維度數(shù)據(jù)分析(GPS定位、日歷安排、實(shí)時(shí)路況)發(fā)現(xiàn)你可能要去參加下午2點(diǎn)的一個(gè)重要會(huì)議。
這時(shí),AI系統(tǒng)會(huì)主動(dòng)檢測(cè)到當(dāng)前路段正在施工,預(yù)計(jì)會(huì)造成15分鐘延誤。于是便自動(dòng)計(jì)算出你需要提前10分鐘出發(fā),在你還沒有主動(dòng)查詢的情況下,就把最優(yōu)繞行路線推送到你的車載系統(tǒng)。
這樣的交互方式,充分利用了手機(jī)作為隨身設(shè)備的特性,將各種零散的數(shù)據(jù)點(diǎn)(位置、時(shí)間、生理數(shù)據(jù)、日程表等)有機(jī)整合,主動(dòng)為用戶創(chuàng)造價(jià)值,而不是被動(dòng)等待指令。
這才是真正符合移動(dòng)場(chǎng)景的AI應(yīng)用方式,而不是簡(jiǎn)單地把電腦上的Copilot或ChatGPT搬到手機(jī)上。
如果用這樣的標(biāo)準(zhǔn)來(lái)看,很顯然,無(wú)論是華為、榮耀還是蘋果,都未能達(dá)到這樣的“理想境界”。其所謂的“自動(dòng)化”,僅僅是用語(yǔ)音交互+Agent,將原本并沒多復(fù)雜的步驟再精簡(jiǎn)了些許。
這就引出了另一個(gè)重要問題:對(duì)用戶來(lái)說,他們是否真的愿意為目前這些華而不實(shí),錦上添花的“AI功能”支付高昂的溢價(jià)?
對(duì)此,華爾街著名的科技分析師、被譽(yù)為“科技股教父”之一的Dan Ives評(píng)論道:手機(jī)廠商在AI領(lǐng)域的投入將在2024年達(dá)到歷史新高,但這種投入與實(shí)際收益之間存在巨大鴻溝。我們看到的是一場(chǎng)昂貴的“AI軍備競(jìng)賽”,最終受害的是消費(fèi)者的錢包。
前期優(yōu)勢(shì)正被稀釋?
面對(duì)手機(jī)換機(jī)周期不斷延長(zhǎng),以及零部件成本持續(xù)攀升的雙重挑戰(zhàn),對(duì)于榮耀來(lái)說,在過去的一年多里,其在AI方面的投入,不可謂不激進(jìn),2023年,榮耀整體研發(fā)投入占到總營(yíng)收的11.5%,其中AI研發(fā)費(fèi)用累計(jì)已達(dá)100億。
盡管自2024年初以來(lái),手機(jī)市場(chǎng)已有明顯的復(fù)蘇跡象;但如此“豪賭”AI的背后,其目前呈現(xiàn)的錦上添花式的AI功能,究竟能否在將來(lái)真正帶動(dòng)消費(fèi)者的購(gòu)機(jī)熱,這恐怕要打一個(gè)大大的問號(hào)。
在獨(dú)立的三年多時(shí)間里,榮耀已經(jīng)發(fā)布了Magic系列、數(shù)字系列、V系列與X系列四大產(chǎn)品體系,布局了超過30款手機(jī),覆蓋2000—10000元價(jià)位段。
但問題是,為了在連續(xù)下行的全球手機(jī)市場(chǎng)中站穩(wěn)腳跟甚至沖擊前五,榮耀不可能僅靠資本們很喜歡的高毛利高端產(chǎn)品來(lái)支撐銷量,還是需要大量的走量機(jī)型。
這就和AI手機(jī)高昂的投入,形成了一個(gè)尖銳的結(jié)構(gòu)性矛盾。
更諷刺的是,在專業(yè)化的大模型企業(yè)的攻勢(shì)下,榮耀等手機(jī)廠商重金投入所鑄就的AI優(yōu)勢(shì),實(shí)際上正一點(diǎn)點(diǎn)被稀釋。
今年10月,有著國(guó)內(nèi)“AI六小虎”之稱的智譜AI,發(fā)布了自身基于Agent技術(shù)的手機(jī)智能體AutoGLM,直接通過模擬人類操作行為,來(lái)實(shí)現(xiàn)手機(jī)上的各種功能。
智譜AI的定位,實(shí)際上是通過AutoGLM這樣的技術(shù),創(chuàng)造了一個(gè)全新的價(jià)值層:它既不是傳統(tǒng)意義上的應(yīng)用層,也不是系統(tǒng)層,而是一個(gè)“元操作層”。
大模型企業(yè)的入局,可能暗示了手機(jī)AI將來(lái)一個(gè)更大的變化:AI能力正在成為一種“基礎(chǔ)設(shè)施”,就像當(dāng)年的互聯(lián)網(wǎng)一樣。對(duì)大模型企業(yè)來(lái)說,他們不需要完整的系統(tǒng)權(quán)限,因?yàn)槲磥?lái)的應(yīng)用可能更多是基于API調(diào)用的“組合式服務(wù)”,而不是傳統(tǒng)的獨(dú)立應(yīng)用。
如此一來(lái),各大手機(jī)廠商推出的獨(dú)立AI系統(tǒng),必定會(huì)受到更多挑戰(zhàn)。但平心而論,即使是這種“實(shí)用性存疑”的狀態(tài),對(duì)很多手機(jī)廠商來(lái)說,也已經(jīng)成為了一個(gè)難以觸及的門檻。
根據(jù)益普索發(fā)布的《AI Phone白皮書》中的衡量標(biāo)準(zhǔn),目前業(yè)內(nèi)的手機(jī)AI,正處在跨越AI Phone的L2級(jí)別,向L3邁進(jìn)。
L3級(jí)別要求手機(jī)“能夠識(shí)別人類情感。實(shí)現(xiàn)任務(wù)級(jí)自主拆解閉環(huán),人與AI協(xié)作并監(jiān)督”。
這就是目前榮耀、蘋果的Agent技術(shù)所達(dá)到的狀態(tài)。
然而,這樣一個(gè)并不太高的標(biāo)準(zhǔn),vivo、OPPO這樣的大廠,也不盡然能完全做到。
以vivo為例,其今年展示的AI系統(tǒng),更多地將焦點(diǎn)放在了“一按一復(fù)制,或一按一拖拽”的這種更偏向傳統(tǒng)的AI交互形式。雖然其OriginOS 5號(hào)稱搭載了vivo自研的手機(jī)智能體「PhoneGPT」,能實(shí)現(xiàn)自動(dòng)訂座這樣的功能,但截至目前,其并未展現(xiàn)出公開的演示。
同樣地,號(hào)稱自研了手機(jī)大模型的OPPO,在目前的公開展示中,也只是將重點(diǎn)放在了AI識(shí)圖、AI一鍵問屏,或是AI修圖等傳統(tǒng)的功能上,總體上給人感覺仍停留在不痛不癢,可有可無(wú)的AI Phone的L1級(jí)別。
從目前來(lái)看,總體功能聊勝于無(wú),交互方式不夠人性、自然,以及專業(yè)化大模型企業(yè)的競(jìng)爭(zhēng)等因素,共同構(gòu)成了目前手機(jī)AI所面臨的種種挑戰(zhàn)。
而對(duì)于上述的難題,即使是身為行業(yè)巨頭的蘋果,目前也未能拿出令人滿意的答案。
例如在自動(dòng)化操作方面,Apple Intelligence展示的所謂“智能代理”功能,實(shí)際上是對(duì)iOS快捷指令的升級(jí)版本。雖然系統(tǒng)能夠理解“幫我訂一張去紐約的機(jī)票”這樣的指令,但其執(zhí)行過程仍然需要預(yù)先配置的應(yīng)用程序支持。
這樣的情形,似乎讓手機(jī)AI陷入了一個(gè)尷尬的境地:既不夠革命性來(lái)滿足市場(chǎng)期待,又不夠完善來(lái)證明其存在的價(jià)值。
但如果回望過去,我們就會(huì)發(fā)現(xiàn):這某種程度上,是因?yàn)槭謾C(jī)廠商們正在重復(fù)PC時(shí)代的老路—— 過度強(qiáng)調(diào)功能堆砌,而忽視了用戶體驗(yàn)的本質(zhì)。