文 | 明晰野望 林森
2024年的尾聲,Siri突然從雞肋變成了香餑餑。
在大模型技術(shù)、AI智能體(AI Agent)飛速發(fā)展帶動下,搭載端側(cè)大模型的AI手機正成為各大硬件手機廠商的兵家必爭之地。
今年四季度,國外的蘋果、三星,國內(nèi)的榮耀、小米、VIVO、OPPO等紛紛發(fā)布了新款A(yù)I手機。其中,Siri這樣的手機智能助手很有可能成為新一代“超級流量入口”。
在手機廠商設(shè)計的未來藍圖中,用戶只需要跟手機智能助手聊天,就能美化照片,甚至可以直接點外賣、打車、購物,Siri們化身為AI“指揮官”,擁有在手機后臺調(diào)用各類軟件APP的權(quán)限。
但是,現(xiàn)實或許沒有那么美。
01 AI手機大競賽
2024年9月,蘋果首款“AI iPhone”iPhone 16發(fā)布,首次將大模型部署在手機內(nèi)存中,正式拉開了AI手機競賽的大幕。
在這之前,榮耀CEO趙明就曾預(yù)告過Magic7系列,并表示這將是首款中國消費者可以體驗AI Agent的手機,“領(lǐng)先蘋果”。與前東家華為“遙遙領(lǐng)先”的口號如出一轍。
10月,榮耀發(fā)布了Magic OS 9.0 ,這款手機使用AI OS,“YOYO智慧助手已經(jīng)打通了多款A(yù)PP,可以實現(xiàn)一句話充值、一句話點外賣等服務(wù)。”
在業(yè)內(nèi),榮耀被認為是將AI端側(cè)大模型落地“最早且最徹底”的廠商。
一度榮耀承接了華為手機丟掉的市場份額,并快速登頂國內(nèi)手機市場。但隨著華為的回歸,榮耀需要承受的競爭壓力也越來越大。
2024年榮耀接連完成了多輪IPO前的重要融資。在與華為分手四年后,擺在榮耀面前的,一邊是上市前的業(yè)績壓力,另一邊是前東家從扶持變競爭的尷尬境地,能否憑借AI手機重振銷量,可謂關(guān)鍵一戰(zhàn),“欲成華為,挑戰(zhàn)蘋果”更成了榮耀的新目標。
對AI手機寄予厚望的顯然不只榮耀一家。
同樣是在10月,小米、vivo、OPPO走馬觀花式地推出了各自的AI手機,端側(cè)大模型的浪潮洶涌而至。
其中,小米發(fā)布了搭載澎湃OS 2的小米15,升級“小愛”為“超級小愛”,支持AI動態(tài)壁紙、AI鎖屏、AI寫作、AI識音、AI字幕、AI妙畫等功能。
vivo發(fā)布了30億參數(shù)量級的藍心端側(cè)大模型3B,同時也公布了自家其他類型的大模型(語音、圖像、多模態(tài))的升級,號稱6年來,vivo在AI方面的投入,累計超過230億元。
OPPO則宣布實現(xiàn)了全球首次MoE(混合專家模型)在端側(cè)的落地,提出了AI即系統(tǒng)(AI as System)的口號,“小布”智能助手支持超1800項指令。
魅族更是在今年2月,提出“All in AI”的戰(zhàn)略,并停止了傳統(tǒng)智能手機新項目,全面發(fā)力AI手機。
相對比蘋果和三星,國產(chǎn)手機廠商全面擁抱AI的態(tài)度甚至更為激進,速度可謂敏捷。
從另一個重要內(nèi)驅(qū)因素來看,各家廠商都急需要找到新的故事和增長點。數(shù)據(jù)顯示,在中國市場,2017年智能手機出貨量接近5億部,到了2023年出貨量已不足3億部,市場萎縮近40%,消費者的換機周期也從一年半延長到兩年半至三年半。
02 端側(cè)AI性能之憂
眾所周知,大模型運行需要芯片、算力、帶寬等等硬條件支持,端側(cè)大模型又是如何在一臺小小的手機上實現(xiàn)智能化的呢?
我們先來看一下國內(nèi)外領(lǐng)先的大模型廠商的技術(shù)參數(shù)——
ChatGPT的締造者OpenAI去年夸耀稱,其GPT-4模型擁有約2萬億個參數(shù)。
12月18日火山引擎官宣豆包大模型發(fā)布以來,在7個月時間里,日均tokens增長超過33倍,日均tokens使用量超過4萬億。
參數(shù)表示AI模型的大小,一般參數(shù)越多,AI模型的能力越強。相對比端側(cè)大模型,ChatGPT、豆包等應(yīng)用背后的大模型都布局在云端。
手機天然受制于終端設(shè)備處理器算力、內(nèi)存、存儲容量,以及電池續(xù)航等各方面技術(shù)限制,與云端大模型動輒成千上萬億的參數(shù)相比,端側(cè)大模型幾十億、哪怕上百億的參數(shù),顯然不在一個量級上。
另一方面,手機廠家發(fā)展端側(cè)大模型,勢必要求終端設(shè)備硬件配置升級,這很有可能大幅推高消費者的購機成本,或以其他方式轉(zhuǎn)嫁給相關(guān)廠商。業(yè)內(nèi)普遍認為,從能耗方面看,電池密度更是短期最難突破的硬件短板。
實際上,目前許多AI手機雖然對外主打自家的端側(cè)大模型,但實際上是搭配了云端大模型的混合式AI路線。例如旗艦手機X100上,vivo將在終端還是云端運行大模型的選擇權(quán)留給了用戶,默認選項是在云端跑。
蘋果雖然也有自家的AI能力,但也依然選擇與更強大的大模型廠家合作。近期,蘋果將與字節(jié)、騰訊開展大模型合作的新聞喧囂塵上。而海外X社交平臺上,就有博主在iOS18.1推出后直言不諱:“我們一直在等待的蘋果智能充其量只是谷歌和 ChatGPT 上的一個漂亮的用戶界面?!敝敝柑O果AI手機是套殼的AI。
03 APP廠家無障礙后門恐遭“盜用”
AI手機端側(cè)大模型除了上述生成內(nèi)容等AI能力之外,更重要的一個賣點在于,可以用自家的智能助手“指揮官”調(diào)用手機上的各類應(yīng)用程序,以用戶的語音指令為導(dǎo)向,一次性、全自動地完成過往需要多次點擊才能完成的操作。
業(yè)內(nèi)人士透露,“在這一輪AI競賽中,手機廠商大已發(fā)展出兩大技術(shù)路線,一種是‘簽訂意圖框架’,另一種是‘模擬用戶識屏+模擬點擊’操作”。
所謂“簽訂意圖框架”模式,主要依靠手機廠商的品牌能力,邀請盡可能多的第三方App軟件廠商加入,共建生態(tài)。
這種模式對手機品牌號召力和生態(tài)影響力要求較高,目前業(yè)內(nèi)主要是蘋果和華為選擇了這種模式。
而所謂“模擬用戶識屏+模擬點擊”模式,是以AI能力識別屏幕,并理解、分析屏幕內(nèi)容,同時訓練一套成熟的模擬點擊各類APP的操作腳本。
例如,用戶如果要點外賣,智能助手就會讓手機系統(tǒng)理解這一指令,并直接在后臺“打開某外賣軟件APP、打開選餐頁面”,繞過第三方App授權(quán),操作其內(nèi)部功能。
目前榮耀等國產(chǎn)安卓手機多采取“模擬識屏+模擬點擊”操作模式。
值得注意的是,“模擬識屏和點擊模式中,有些國產(chǎn)手機直接利用安卓系統(tǒng)為殘障人士開發(fā)的后門‘無障礙權(quán)限’,強行調(diào)用第三方APP應(yīng)用的授權(quán),這里面存在極高的安全、隱私和合規(guī)風險?!鄙鲜鋈耸糠Q。
如果說手機廠商與三方APP的關(guān)系就好比商場物業(yè)與門店商戶,目前行業(yè)通用的API授權(quán)機制則類似于各家門店的鑰匙,物業(yè)需要在獲得門店商戶允許后才可以開門。但AI手機目前的發(fā)展模式,則是在沒有鑰匙的情況下強行調(diào)用各家APP的服務(wù)功能,這相當于商場物業(yè)直接撬開商戶店門,對外出售店內(nèi)的產(chǎn)品與服務(wù)。
無論上述哪一種模式,手機廠商與軟件APP生態(tài)的關(guān)系,乃至整個行業(yè)的競爭秩序都正在受到挑戰(zhàn)。
AI手機廠商的競賽難免,但野蠻式、掠奪式的競賽或難長久。
04 用戶隱私新悖論
近一年來,為了宣傳新手機,許多手機廠商高管都對外宣傳——端側(cè)大模型因為把AI運行在手機硬件里,會讓用戶數(shù)據(jù)和隱私變得更為安全。
但這可能成為一個新的悖論。
如上,無論是通過和APP軟件開發(fā)者簽訂意圖框架,還是濫用無障礙權(quán)、模擬用戶識屏+模擬點擊操作,用戶數(shù)據(jù)一旦授權(quán)給端側(cè)大模型,智能助手們將擁有最大的訪問用戶數(shù)據(jù)的權(quán)限。
業(yè)內(nèi)人士擔憂,當前AI手機對應(yīng)用和服務(wù)的讀取模式下,勢必會出現(xiàn)大量模糊地帶,用戶數(shù)據(jù)安全和隱私保護將成為黑盒子。
“用戶在哪里,哪里就是數(shù)據(jù)和隱私的責任方?!币晃卉浖_發(fā)負責人稱。
比如,蘋果首屆的用戶可能更擔心自己的數(shù)據(jù)被GPT-4讀取,而一些國民級應(yīng)用APP,比如微信、支付寶、抖音的用戶,則更擔心自己的數(shù)據(jù)被硬件廠商無限讀取。
蘋果當初發(fā)布Apple Intelligence(蘋果智能)時,一度因為被媒體誤認為,蘋果提到的“powered by GPT-4”,是將其核心數(shù)據(jù)“出賣”給了OpenAI,引發(fā)了其股價波動,隨后蘋果官方緊急辟謠。
在端側(cè)大模型的訓練中,用戶在APP應(yīng)用中的數(shù)據(jù)可能成為新的喂料,用戶個人信息即便在APP內(nèi)刪除,也會轉(zhuǎn)化為一種“知識”、“規(guī)律”被嵌入在端側(cè)模型和應(yīng)用系統(tǒng)之中,個人隱私和行為習慣數(shù)據(jù)有可能永遠無法刪除。
05 寫在最后
在行業(yè)秩序?qū)用?,未?jīng)開發(fā)者,硬件廠家濫用“無障礙權(quán)限”采取模擬讀屏和點擊等方式獲取APP功能是否合法?硬件廠家和APP軟件行業(yè)將共創(chuàng)哪些新的行業(yè)合作規(guī)則?
在用戶隱私層面,端側(cè)大模型是否會加大用戶隱私問題?大模型對用戶交互類數(shù)據(jù)的智能化挖掘是否還會產(chǎn)生新的隱私和安全問題?
AI硬件時代大勢已至,但一系列新的問題值得思索,新的秩序急需建立。