正在閱讀:

別硬把大模型往手機(jī)里塞

掃一掃下載界面新聞APP

別硬把大模型往手機(jī)里塞

故事還是事故?

?文|科技新知

商業(yè)迷霧當(dāng)中,那些看似金光閃閃的“機(jī)會(huì)”,往往是一把將人們困住的鐐銬。

CNBC最新消息稱,全球芯片巨頭高通打算在加州兩大據(jù)點(diǎn)砍掉約1258名員工。事實(shí)上,高通早就向加州就業(yè)部門送交了這份“死亡名單”:圣迭戈1064名、圣克拉拉194名。這場(chǎng)人事地震預(yù)計(jì)將在12月13日爆發(fā)。

高通上個(gè)季度的報(bào)告中,已經(jīng)暗示了這次“血洗”。從財(cái)務(wù)結(jié)構(gòu)來看,手機(jī)芯片是高通的主要收入來源,占比超過一半,但在三季度里收入同比下降了21.6%。智能手機(jī)市場(chǎng)的飽和,像一把無形的大手,正在悄悄扼殺上游供應(yīng)鏈的巨頭。

手機(jī)市場(chǎng)的增長(zhǎng)現(xiàn)在主要依賴于設(shè)備的升級(jí)周期。自2019年以來,受5G驅(qū)動(dòng)的手機(jī)更換熱潮已經(jīng)持續(xù)了近四年。但Counterpoint的資深分析師Peter Richardson卻揭示了一個(gè)冷酷的事實(shí):到2022年時(shí),全球手機(jī)更換周期已達(dá)到史上最長(zhǎng)的43個(gè)月。

過去五年,手機(jī)界苦苦追尋創(chuàng)新之路,急于改變僵局。但當(dāng)連Apple這樣的市場(chǎng)領(lǐng)導(dǎo)者也難以拿出令人震撼的新功能時(shí),其他廠商更是難以維持其市場(chǎng)地位。越來越多的消費(fèi)者開始質(zhì)疑,換一部新手機(jī)的價(jià)值究竟在哪?

有行業(yè)專家指出,真正的破局點(diǎn)或許是軟件,尤其是AI領(lǐng)域像LLM、Transformer等大模型背后蘊(yùn)藏著的力量。

盡管目前還不清楚,該如何最大化地利用這些潛力,但這并不妨礙國(guó)內(nèi)手機(jī)巨頭試圖突圍。華米OV等都把目光瞄準(zhǔn)了AI大模型,迫切要開辟一個(gè)新戰(zhàn)場(chǎng)。

手機(jī)巨頭爭(zhēng)斗大模型賽場(chǎng)

一時(shí)之間,國(guó)內(nèi)手機(jī)廠商好像都追起了大模型的風(fēng)頭。

8月14日,小米年度發(fā)布會(huì)上,小米AI大模型亮相,霎那之間成為焦點(diǎn)。在C-Eval、CMMLU兩大測(cè)試平臺(tái)上,它分別斬獲第十名和中文榜首的佳績(jī)。

雷軍信心滿滿地宣布,小米的這個(gè)13億參數(shù)大模型已經(jīng)在手機(jī)端完美運(yùn)行,其實(shí)力在某些場(chǎng)景中甚至能與60億參數(shù)的云端模型匹敵。而家喻戶曉的小愛同學(xué)也將強(qiáng)化AI大模型的能力,邀請(qǐng)測(cè)試已在發(fā)布會(huì)當(dāng)天拉開序幕。

瞄準(zhǔn)AI大模型的狼煙不只在小米一處升起。

早在8月4日的2023年華為開發(fā)者大會(huì),余承東就大手一揮,宣布HarmonyOS 4將受益于“盤古大模型”的加持。與眾不同的是,華為決定將大模型深度整合進(jìn)手機(jī)系統(tǒng),實(shí)現(xiàn)更高層次的融合。

繼華米之后,vivo和OPPO亦不斷展露其對(duì)大模型領(lǐng)域的雄心。

近期,OPPO宣布對(duì)其全新“小布助手”進(jìn)行首輪公開測(cè)試,引發(fā)業(yè)內(nèi)關(guān)注。此產(chǎn)品基于了AndesGPT大模型技術(shù)。

AndesGPT模型出自O(shè)PPO旗下安第斯智能云團(tuán)隊(duì)之手,其核心是一個(gè)基于混合云架構(gòu)的高級(jí)生成式大語(yǔ)言模型。用戶可以通過喚醒小布語(yǔ)音助手并說出“小布大模型”,參與小布1.0公測(cè)版報(bào)名。更多信息將在11月16日的ColorOS 14發(fā)布會(huì)上公布。

與同行的宣傳異曲同工,AndesGPT在其官方介紹中也榮獲了“行業(yè)翹楚”等封號(hào),此模型在多個(gè)權(quán)威評(píng)測(cè)榜單上頻頻亮相。

另一個(gè)戰(zhàn)線上,vivo已鎖定11月1日,要召開年度開發(fā)者大會(huì)。此番集結(jié),vivo將揭曉其獨(dú)家研發(fā)的AI大模型與全新操作系統(tǒng);而廣受矚目的OriginOS 4也將初露鋒芒。

尤其引人關(guān)注的,vivo打造的AI大模型矩陣極為豐富,覆蓋了十億、百億及千億三大參數(shù)級(jí)別,共五款模型,旨在滿足多樣化的核心應(yīng)用場(chǎng)景。

同樣,這批尚在神秘面紗后的產(chǎn)品,已在多個(gè)權(quán)威評(píng)測(cè)中嶄露頭角。最新數(shù)據(jù)顯示,vivo自研AI大模型在C-Eval和CMMLU兩大平臺(tái)上均雄踞榜首。

近期,手機(jī)行業(yè)已經(jīng)見證了各大品牌逐個(gè)投身于AI大模型的深海。存量市場(chǎng)的激烈爭(zhēng)奪,使得各大廠商都希望借助新技術(shù)鋒芒,為自身在高端市場(chǎng)塑造更具競(jìng)爭(zhēng)力的形象。

多位行業(yè)內(nèi)有深度洞察的人士認(rèn)為,強(qiáng)調(diào)AI功能的優(yōu)勢(shì),顯然是各大廠商策略的重要一環(huán)。不僅能刺激用戶對(duì)高端產(chǎn)品的欲望,更能帶動(dòng)產(chǎn)品價(jià)格上漲,從而為品牌創(chuàng)造更為豐厚的利潤(rùn)。

隨著時(shí)間的推移或能見到,首波真正的“AI手機(jī)”即將震撼登場(chǎng),而未來兩年,更會(huì)是AI在手機(jī)上的創(chuàng)新大爆發(fā)時(shí)刻。

大模型角逐移動(dòng)端,路徑逐漸統(tǒng)一

雖然手機(jī)廠商們?cè)谛麄髦斜憩F(xiàn)得在手機(jī)上運(yùn)行大型模型就如同喝水吃飯般輕松,但實(shí)際操作中,背后隱藏的挑戰(zhàn)遠(yuǎn)超預(yù)期。

根據(jù)小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍的分享,要真正在手機(jī)上運(yùn)行大模型,對(duì)手機(jī)硬件的要求絕不會(huì)低,特別是處理器和內(nèi)存兩項(xiàng)。

大模型首先就是其“大”的特性,一旦占據(jù)過多的手機(jī)工作內(nèi)存,將導(dǎo)致其他應(yīng)用受限,甚至可能造成手機(jī)無響應(yīng)、整體性能銳減,或者最糟糕的情況是直接死機(jī)。

此外,計(jì)算能力也是評(píng)判的關(guān)鍵點(diǎn)。若生成一個(gè)字符就需要花費(fèi)好幾秒的時(shí)間,這對(duì)于用戶體驗(yàn)無疑是災(zāi)難性的??紤]到人們的平均閱讀速度約為每秒十幾個(gè)漢字,故模型的“生成速度”必須遠(yuǎn)超于此。

而功耗問題也不容忽視。許多網(wǎng)上的模型Demo常常疏忽這一關(guān)鍵環(huán)節(jié)。高負(fù)載下的計(jì)算芯片會(huì)導(dǎo)致手機(jī)急速發(fā)熱,若如此長(zhǎng)時(shí)間運(yùn)作,勢(shì)必會(huì)對(duì)電池的續(xù)航產(chǎn)生嚴(yán)重?fù)p害。

綜上,手機(jī)大模型真正的挑戰(zhàn)在于如何在處理速度、散熱和電池續(xù)航等之間找到一個(gè)精妙的平衡。因此,業(yè)界的重心還放在了端云協(xié)同之上。

不久前,聯(lián)發(fā)科與OPPO達(dá)成協(xié)議,共同研發(fā)大模型在端側(cè)的輕量化部署方案,旨在讓大模型技術(shù)更為貼近消費(fèi)者的實(shí)際使用。

10月18日,聯(lián)發(fā)科同樣宣布與vivo在AI領(lǐng)域深度合作和聯(lián)調(diào),實(shí)現(xiàn)了10億和70億AI大語(yǔ)言模型以及10億AI視覺大模型在手機(jī)端側(cè)的落地,共同為消費(fèi)者帶來端側(cè)生成式AI應(yīng)用創(chuàng)新體驗(yàn)。

端側(cè)大模型的好處是,用戶可以享受更快的響應(yīng)速度,同時(shí)數(shù)據(jù)也不需要上傳到云端,更加安全。目前許多主流廠商都在研發(fā)在移動(dòng)終端部署 AI大模型的解決方案,以實(shí)現(xiàn)在端側(cè)運(yùn)行大模型的目標(biāo)。

然而,不能假定僅憑手機(jī)端便能解決所有問題。正如小米透露的,他們將繼續(xù)遵循端云結(jié)合的策略。某些功能或能力,如果可以通過端側(cè)的模型來實(shí)現(xiàn),就無需轉(zhuǎn)移到云端處理。

觀察vivo的情況,雖然缺乏確切的數(shù)據(jù),但可以合理推測(cè),它也將采納云端和本地結(jié)合的大模型策略。

從其大模型的參數(shù)量級(jí)可以分析,660億、1300億和1750億量級(jí)的云端大模型目的在于確保處理能力,以應(yīng)對(duì)更復(fù)雜的問題。而10億和70億量級(jí)的本地大模型則是為了確保用戶隱私、能效和快速響應(yīng)。

這意味著,vivo很可能會(huì)采取端云協(xié)同工作的方式,即通過評(píng)估問題的復(fù)雜性來決定是否在本地處理或轉(zhuǎn)移到云端。

結(jié)合云端和本地的大模型不僅可以有效地節(jié)省成本,而且能夠滿足用戶在計(jì)算能力、性能、能耗和隱私保護(hù)等多個(gè)方面的需求,這無疑是目前整合手機(jī)和AI大模型的優(yōu)選策略之一。

廠商跟風(fēng)之下,一些潛在的挑戰(zhàn)

某些業(yè)內(nèi)觀點(diǎn),將目前嘗試在手機(jī)端運(yùn)行大模型的技術(shù)視作一柄鋒利之劍。然而深入背后,也不免露出一種應(yīng)景而非真正求變的短視之感。

首先,對(duì)于“大模型”的界定仍舊模糊不清。以小米的端側(cè)模型為例,其參數(shù)量達(dá)到13億,與GPT2的1.5B參數(shù)相差無幾,但這真的足以賦予其“大模型”的頭銜嗎?

不乏有業(yè)界人士拋出質(zhì)疑:手機(jī)端的大模型實(shí)踐,更多地是為了滿足市場(chǎng)短期熱潮,而非技術(shù)的真正躍進(jìn)。若手機(jī)真的能毫不費(fèi)力地驅(qū)動(dòng)大模型,那顯卡巨頭英偉達(dá)的存在意義又在哪里?

再者,為了讓大模型適應(yīng)手機(jī),制造商不得不通過剪枝、蒸餾和量化等策略對(duì)其進(jìn)行大幅壓縮。以vivo為例,它可能通過連續(xù)的模型裁剪和蒸餾,將參數(shù)從1750億降低到僅10億,這種操作是否過于牽強(qiáng),值得思考。

要認(rèn)識(shí)到,大模型并不僅僅是參數(shù)數(shù)量的簡(jiǎn)單疊加,它的真正價(jià)值在于深度學(xué)習(xí)中的“深度”。大量的參數(shù)意味著更多的信息、知識(shí)和上下文的捕捉。

因此,當(dāng)把一款千億參數(shù)的模型剪裁到幾十億參數(shù)時(shí),勢(shì)必要失去一些原有的學(xué)習(xí)深度。對(duì)于AI的日常應(yīng)用來說,可能影響不大,但對(duì)于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。

即便小米宣稱其端側(cè)模型能與云端模型相提并論,但這其中的細(xì)節(jié)仍不容忽視。擁有13億參數(shù)的端側(cè)模型自然難以與擁有千億參數(shù)的云端模型相比。為了彌補(bǔ)這種差距,小米可以選擇讓其端側(cè)模型在特定場(chǎng)景下與云端模型匹敵,但終歸不能全面比肩。

從這些層面出發(fā),當(dāng)前手機(jī)上的大模型實(shí)現(xiàn)方式似乎有點(diǎn)“矯枉過正”。對(duì)于普通用戶而言,他們并不真正關(guān)心模型的參數(shù)數(shù)量,而更關(guān)心能為他們帶來什么價(jià)值。vivo和小米的這些嘗試固然值得鼓勵(lì),但也應(yīng)該反思其真正的目的和意義。

更重要的是,盡管眾多手機(jī)制造商都在積極探索AI大模型的應(yīng)用,但未來的路徑仍然充滿未知。手機(jī)市場(chǎng)上,什么才是下一個(gè)“殺手級(jí)”應(yīng)用,還有待時(shí)日揭曉。

目前手機(jī)制造商對(duì)AI大模型的具體應(yīng)用似乎過于偏重“語(yǔ)音助手”。這種單一方向的追求,是否只是迎合了科技熱點(diǎn)趨勢(shì),而非真正考慮用戶的實(shí)際需求?

以近期知名博主對(duì)vivo新款A(yù)I大模型的分享為例,盡管其在OriginOS 4上以煥然新姿亮相,但與現(xiàn)行的語(yǔ)音助手相比,核心并無太大顛覆。

簡(jiǎn)而言之,AI大模型在手機(jī)領(lǐng)域的真正普及仍舊步履蹣跚。如今的種種努力,只是冰山初露的探秘之旅。

參考資料:

騰訊科技-小米的大模型“野心”,始于端側(cè)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

小米

6.4k
  • 小米日本公司社長(zhǎng):將在日推出實(shí)體店推介物聯(lián)網(wǎng)功能
  • 小米汽車:精英駕駛培訓(xùn)將會(huì)在全國(guó)范圍內(nèi)陸續(xù)開展

華為

8.2k
  • 盤前機(jī)會(huì)前瞻| 華為每年投入超60億激勵(lì)開發(fā)者,鴻蒙系統(tǒng)迎來快速釋放期,這幾家鴻蒙產(chǎn)業(yè)鏈企業(yè)有望持續(xù)受益(附概念股)
  • 9月11日投資早報(bào)|延遲退休決定草案提請(qǐng)審議,華為發(fā)布全球首款三折疊屏手機(jī),今日一只新股上市

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

別硬把大模型往手機(jī)里塞

故事還是事故?

?文|科技新知

商業(yè)迷霧當(dāng)中,那些看似金光閃閃的“機(jī)會(huì)”,往往是一把將人們困住的鐐銬。

CNBC最新消息稱,全球芯片巨頭高通打算在加州兩大據(jù)點(diǎn)砍掉約1258名員工。事實(shí)上,高通早就向加州就業(yè)部門送交了這份“死亡名單”:圣迭戈1064名、圣克拉拉194名。這場(chǎng)人事地震預(yù)計(jì)將在12月13日爆發(fā)。

高通上個(gè)季度的報(bào)告中,已經(jīng)暗示了這次“血洗”。從財(cái)務(wù)結(jié)構(gòu)來看,手機(jī)芯片是高通的主要收入來源,占比超過一半,但在三季度里收入同比下降了21.6%。智能手機(jī)市場(chǎng)的飽和,像一把無形的大手,正在悄悄扼殺上游供應(yīng)鏈的巨頭。

手機(jī)市場(chǎng)的增長(zhǎng)現(xiàn)在主要依賴于設(shè)備的升級(jí)周期。自2019年以來,受5G驅(qū)動(dòng)的手機(jī)更換熱潮已經(jīng)持續(xù)了近四年。但Counterpoint的資深分析師Peter Richardson卻揭示了一個(gè)冷酷的事實(shí):到2022年時(shí),全球手機(jī)更換周期已達(dá)到史上最長(zhǎng)的43個(gè)月。

過去五年,手機(jī)界苦苦追尋創(chuàng)新之路,急于改變僵局。但當(dāng)連Apple這樣的市場(chǎng)領(lǐng)導(dǎo)者也難以拿出令人震撼的新功能時(shí),其他廠商更是難以維持其市場(chǎng)地位。越來越多的消費(fèi)者開始質(zhì)疑,換一部新手機(jī)的價(jià)值究竟在哪?

有行業(yè)專家指出,真正的破局點(diǎn)或許是軟件,尤其是AI領(lǐng)域像LLM、Transformer等大模型背后蘊(yùn)藏著的力量。

盡管目前還不清楚,該如何最大化地利用這些潛力,但這并不妨礙國(guó)內(nèi)手機(jī)巨頭試圖突圍。華米OV等都把目光瞄準(zhǔn)了AI大模型,迫切要開辟一個(gè)新戰(zhàn)場(chǎng)。

手機(jī)巨頭爭(zhēng)斗大模型賽場(chǎng)

一時(shí)之間,國(guó)內(nèi)手機(jī)廠商好像都追起了大模型的風(fēng)頭。

8月14日,小米年度發(fā)布會(huì)上,小米AI大模型亮相,霎那之間成為焦點(diǎn)。在C-Eval、CMMLU兩大測(cè)試平臺(tái)上,它分別斬獲第十名和中文榜首的佳績(jī)。

雷軍信心滿滿地宣布,小米的這個(gè)13億參數(shù)大模型已經(jīng)在手機(jī)端完美運(yùn)行,其實(shí)力在某些場(chǎng)景中甚至能與60億參數(shù)的云端模型匹敵。而家喻戶曉的小愛同學(xué)也將強(qiáng)化AI大模型的能力,邀請(qǐng)測(cè)試已在發(fā)布會(huì)當(dāng)天拉開序幕。

瞄準(zhǔn)AI大模型的狼煙不只在小米一處升起。

早在8月4日的2023年華為開發(fā)者大會(huì),余承東就大手一揮,宣布HarmonyOS 4將受益于“盤古大模型”的加持。與眾不同的是,華為決定將大模型深度整合進(jìn)手機(jī)系統(tǒng),實(shí)現(xiàn)更高層次的融合。

繼華米之后,vivo和OPPO亦不斷展露其對(duì)大模型領(lǐng)域的雄心。

近期,OPPO宣布對(duì)其全新“小布助手”進(jìn)行首輪公開測(cè)試,引發(fā)業(yè)內(nèi)關(guān)注。此產(chǎn)品基于了AndesGPT大模型技術(shù)。

AndesGPT模型出自O(shè)PPO旗下安第斯智能云團(tuán)隊(duì)之手,其核心是一個(gè)基于混合云架構(gòu)的高級(jí)生成式大語(yǔ)言模型。用戶可以通過喚醒小布語(yǔ)音助手并說出“小布大模型”,參與小布1.0公測(cè)版報(bào)名。更多信息將在11月16日的ColorOS 14發(fā)布會(huì)上公布。

與同行的宣傳異曲同工,AndesGPT在其官方介紹中也榮獲了“行業(yè)翹楚”等封號(hào),此模型在多個(gè)權(quán)威評(píng)測(cè)榜單上頻頻亮相。

另一個(gè)戰(zhàn)線上,vivo已鎖定11月1日,要召開年度開發(fā)者大會(huì)。此番集結(jié),vivo將揭曉其獨(dú)家研發(fā)的AI大模型與全新操作系統(tǒng);而廣受矚目的OriginOS 4也將初露鋒芒。

尤其引人關(guān)注的,vivo打造的AI大模型矩陣極為豐富,覆蓋了十億、百億及千億三大參數(shù)級(jí)別,共五款模型,旨在滿足多樣化的核心應(yīng)用場(chǎng)景。

同樣,這批尚在神秘面紗后的產(chǎn)品,已在多個(gè)權(quán)威評(píng)測(cè)中嶄露頭角。最新數(shù)據(jù)顯示,vivo自研AI大模型在C-Eval和CMMLU兩大平臺(tái)上均雄踞榜首。

近期,手機(jī)行業(yè)已經(jīng)見證了各大品牌逐個(gè)投身于AI大模型的深海。存量市場(chǎng)的激烈爭(zhēng)奪,使得各大廠商都希望借助新技術(shù)鋒芒,為自身在高端市場(chǎng)塑造更具競(jìng)爭(zhēng)力的形象。

多位行業(yè)內(nèi)有深度洞察的人士認(rèn)為,強(qiáng)調(diào)AI功能的優(yōu)勢(shì),顯然是各大廠商策略的重要一環(huán)。不僅能刺激用戶對(duì)高端產(chǎn)品的欲望,更能帶動(dòng)產(chǎn)品價(jià)格上漲,從而為品牌創(chuàng)造更為豐厚的利潤(rùn)。

隨著時(shí)間的推移或能見到,首波真正的“AI手機(jī)”即將震撼登場(chǎng),而未來兩年,更會(huì)是AI在手機(jī)上的創(chuàng)新大爆發(fā)時(shí)刻。

大模型角逐移動(dòng)端,路徑逐漸統(tǒng)一

雖然手機(jī)廠商們?cè)谛麄髦斜憩F(xiàn)得在手機(jī)上運(yùn)行大型模型就如同喝水吃飯般輕松,但實(shí)際操作中,背后隱藏的挑戰(zhàn)遠(yuǎn)超預(yù)期。

根據(jù)小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍的分享,要真正在手機(jī)上運(yùn)行大模型,對(duì)手機(jī)硬件的要求絕不會(huì)低,特別是處理器和內(nèi)存兩項(xiàng)。

大模型首先就是其“大”的特性,一旦占據(jù)過多的手機(jī)工作內(nèi)存,將導(dǎo)致其他應(yīng)用受限,甚至可能造成手機(jī)無響應(yīng)、整體性能銳減,或者最糟糕的情況是直接死機(jī)。

此外,計(jì)算能力也是評(píng)判的關(guān)鍵點(diǎn)。若生成一個(gè)字符就需要花費(fèi)好幾秒的時(shí)間,這對(duì)于用戶體驗(yàn)無疑是災(zāi)難性的??紤]到人們的平均閱讀速度約為每秒十幾個(gè)漢字,故模型的“生成速度”必須遠(yuǎn)超于此。

而功耗問題也不容忽視。許多網(wǎng)上的模型Demo常常疏忽這一關(guān)鍵環(huán)節(jié)。高負(fù)載下的計(jì)算芯片會(huì)導(dǎo)致手機(jī)急速發(fā)熱,若如此長(zhǎng)時(shí)間運(yùn)作,勢(shì)必會(huì)對(duì)電池的續(xù)航產(chǎn)生嚴(yán)重?fù)p害。

綜上,手機(jī)大模型真正的挑戰(zhàn)在于如何在處理速度、散熱和電池續(xù)航等之間找到一個(gè)精妙的平衡。因此,業(yè)界的重心還放在了端云協(xié)同之上。

不久前,聯(lián)發(fā)科與OPPO達(dá)成協(xié)議,共同研發(fā)大模型在端側(cè)的輕量化部署方案,旨在讓大模型技術(shù)更為貼近消費(fèi)者的實(shí)際使用。

10月18日,聯(lián)發(fā)科同樣宣布與vivo在AI領(lǐng)域深度合作和聯(lián)調(diào),實(shí)現(xiàn)了10億和70億AI大語(yǔ)言模型以及10億AI視覺大模型在手機(jī)端側(cè)的落地,共同為消費(fèi)者帶來端側(cè)生成式AI應(yīng)用創(chuàng)新體驗(yàn)。

端側(cè)大模型的好處是,用戶可以享受更快的響應(yīng)速度,同時(shí)數(shù)據(jù)也不需要上傳到云端,更加安全。目前許多主流廠商都在研發(fā)在移動(dòng)終端部署 AI大模型的解決方案,以實(shí)現(xiàn)在端側(cè)運(yùn)行大模型的目標(biāo)。

然而,不能假定僅憑手機(jī)端便能解決所有問題。正如小米透露的,他們將繼續(xù)遵循端云結(jié)合的策略。某些功能或能力,如果可以通過端側(cè)的模型來實(shí)現(xiàn),就無需轉(zhuǎn)移到云端處理。

觀察vivo的情況,雖然缺乏確切的數(shù)據(jù),但可以合理推測(cè),它也將采納云端和本地結(jié)合的大模型策略。

從其大模型的參數(shù)量級(jí)可以分析,660億、1300億和1750億量級(jí)的云端大模型目的在于確保處理能力,以應(yīng)對(duì)更復(fù)雜的問題。而10億和70億量級(jí)的本地大模型則是為了確保用戶隱私、能效和快速響應(yīng)。

這意味著,vivo很可能會(huì)采取端云協(xié)同工作的方式,即通過評(píng)估問題的復(fù)雜性來決定是否在本地處理或轉(zhuǎn)移到云端。

結(jié)合云端和本地的大模型不僅可以有效地節(jié)省成本,而且能夠滿足用戶在計(jì)算能力、性能、能耗和隱私保護(hù)等多個(gè)方面的需求,這無疑是目前整合手機(jī)和AI大模型的優(yōu)選策略之一。

廠商跟風(fēng)之下,一些潛在的挑戰(zhàn)

某些業(yè)內(nèi)觀點(diǎn),將目前嘗試在手機(jī)端運(yùn)行大模型的技術(shù)視作一柄鋒利之劍。然而深入背后,也不免露出一種應(yīng)景而非真正求變的短視之感。

首先,對(duì)于“大模型”的界定仍舊模糊不清。以小米的端側(cè)模型為例,其參數(shù)量達(dá)到13億,與GPT2的1.5B參數(shù)相差無幾,但這真的足以賦予其“大模型”的頭銜嗎?

不乏有業(yè)界人士拋出質(zhì)疑:手機(jī)端的大模型實(shí)踐,更多地是為了滿足市場(chǎng)短期熱潮,而非技術(shù)的真正躍進(jìn)。若手機(jī)真的能毫不費(fèi)力地驅(qū)動(dòng)大模型,那顯卡巨頭英偉達(dá)的存在意義又在哪里?

再者,為了讓大模型適應(yīng)手機(jī),制造商不得不通過剪枝、蒸餾和量化等策略對(duì)其進(jìn)行大幅壓縮。以vivo為例,它可能通過連續(xù)的模型裁剪和蒸餾,將參數(shù)從1750億降低到僅10億,這種操作是否過于牽強(qiáng),值得思考。

要認(rèn)識(shí)到,大模型并不僅僅是參數(shù)數(shù)量的簡(jiǎn)單疊加,它的真正價(jià)值在于深度學(xué)習(xí)中的“深度”。大量的參數(shù)意味著更多的信息、知識(shí)和上下文的捕捉。

因此,當(dāng)把一款千億參數(shù)的模型剪裁到幾十億參數(shù)時(shí),勢(shì)必要失去一些原有的學(xué)習(xí)深度。對(duì)于AI的日常應(yīng)用來說,可能影響不大,但對(duì)于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。

即便小米宣稱其端側(cè)模型能與云端模型相提并論,但這其中的細(xì)節(jié)仍不容忽視。擁有13億參數(shù)的端側(cè)模型自然難以與擁有千億參數(shù)的云端模型相比。為了彌補(bǔ)這種差距,小米可以選擇讓其端側(cè)模型在特定場(chǎng)景下與云端模型匹敵,但終歸不能全面比肩。

從這些層面出發(fā),當(dāng)前手機(jī)上的大模型實(shí)現(xiàn)方式似乎有點(diǎn)“矯枉過正”。對(duì)于普通用戶而言,他們并不真正關(guān)心模型的參數(shù)數(shù)量,而更關(guān)心能為他們帶來什么價(jià)值。vivo和小米的這些嘗試固然值得鼓勵(lì),但也應(yīng)該反思其真正的目的和意義。

更重要的是,盡管眾多手機(jī)制造商都在積極探索AI大模型的應(yīng)用,但未來的路徑仍然充滿未知。手機(jī)市場(chǎng)上,什么才是下一個(gè)“殺手級(jí)”應(yīng)用,還有待時(shí)日揭曉。

目前手機(jī)制造商對(duì)AI大模型的具體應(yīng)用似乎過于偏重“語(yǔ)音助手”。這種單一方向的追求,是否只是迎合了科技熱點(diǎn)趨勢(shì),而非真正考慮用戶的實(shí)際需求?

以近期知名博主對(duì)vivo新款A(yù)I大模型的分享為例,盡管其在OriginOS 4上以煥然新姿亮相,但與現(xiàn)行的語(yǔ)音助手相比,核心并無太大顛覆。

簡(jiǎn)而言之,AI大模型在手機(jī)領(lǐng)域的真正普及仍舊步履蹣跚。如今的種種努力,只是冰山初露的探秘之旅。

參考資料:

騰訊科技-小米的大模型“野心”,始于端側(cè)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。