正在閱讀:

當(dāng)AI手機(jī)遭遇內(nèi)存限制,谷歌Pixel 8“一刀切”不可???

掃一掃下載界面新聞APP

當(dāng)AI手機(jī)遭遇內(nèi)存限制,谷歌Pixel 8“一刀切”不可?。?/h1>

內(nèi)存不足是AI大模型手機(jī)的攔路虎。

文|雷科技

2023年10月4日,Google在紐約舉辦了「Made by Google」硬件發(fā)布會(huì),并正式發(fā)布了Pixel 8和Pixel 8 Pro。Pixel 8系列作為首批搭載Android 14系統(tǒng)的手機(jī),據(jù)官方介紹其最大亮點(diǎn)就是AI功能。在發(fā)布會(huì)持續(xù)的一小時(shí)內(nèi),「AI」一詞被提及超過50次,可見Google對這一功能的重視,以及AI是Pixel 8核心賣點(diǎn)的事實(shí)。

然而讓人意外的是,日前Google以「硬件限制」為理由,拒絕在Pixel 8上運(yùn)行最新的人工智能模型「Gemini Nano」。Google隨后宣布即將在6月的季度更新中為Pixel 8提供「Gemini Nano」功能,但用戶只能在隱藏的開發(fā)者選項(xiàng)中開啟。

對于此事,谷歌設(shè)備和服務(wù)軟件副總裁Seang Chau解釋稱,為了能隨時(shí)調(diào)用「Gemini Nano」模型,部分AI模型會(huì)常駐內(nèi)存。而Pixel 8只有8GB內(nèi)存,如果貿(mào)然啟用「Gemini Nano」功能,很可能會(huì)影響用戶的使用體驗(yàn)。與之相反,Pixel 8 Pro擁有12GB內(nèi)存,能比較好地釋放AI模型性能。

從Seang Chau的回復(fù)來看,Pixel 8并不是不能使用「Gemini Nano」,而是使用后會(huì)占用大量手機(jī)系統(tǒng)內(nèi)存,導(dǎo)致其他應(yīng)用的體驗(yàn)感下降。作為參考,三星Galaxy S24系列8GB內(nèi)存版本就可運(yùn)行Gemini Nano模型,而沒有這方面的限制。

“一刀切”能否克服端側(cè)大模型劣勢?

目前,大模型已經(jīng)成為手機(jī)廠商們的「必爭之地」,小米、華為、榮耀、OPPO、vivo等手機(jī)廠商均已發(fā)布搭載大模型的旗艦機(jī)型。像華為的盤古大模型、小米的MiLM、OPPO的安第斯大模型、vivo的藍(lán)心大模型以及榮耀的魔法大模型,也隨著新機(jī)發(fā)布首次走進(jìn)消費(fèi)者的視野。在以上大模型解決方案中,有以云端為主的,也有云端與端側(cè)相結(jié)合的,但幾乎沒有純端側(cè)的大模型。

所謂的「端側(cè)」,指的是將大模型服務(wù)布置在手機(jī)設(shè)備內(nèi)部的芯片之中,僅利用芯片的算力生成結(jié)果。與云端大模型相比,這種方案的優(yōu)勢是不需要聯(lián)網(wǎng),因此數(shù)據(jù)不用上傳至云端,減少了泄露風(fēng)險(xiǎn),并在一定程度上減輕了云成本。

但純端側(cè)方案也有其不可忽視的劣勢,就是算力有限。如果手機(jī)設(shè)備只是接入云端大模型,自然不需要終端設(shè)備擁有多強(qiáng)的算力和AI芯片,但如果在手機(jī)本地運(yùn)營端側(cè)大模型,則對算力有著極高的要求。盡管從理論上來說,常規(guī)手機(jī)芯片中的GPU、CPU都能進(jìn)行并行計(jì)算,但在效率和能耗控制方面仍比不上AI芯片中專門用于AI加速計(jì)算的NPU/TPU等神經(jīng)處理單元,更別提動(dòng)輒擁有幾百上千張頂級(jí)顯卡的云端后臺(tái)了。

而Google的「Gemini Nano」在發(fā)布之初,就已經(jīng)將其定位為在移動(dòng)設(shè)備上本地運(yùn)行的端側(cè)大模型,并且其內(nèi)置在Android 14系統(tǒng)中。也就是說,未來如果其他開發(fā)者想通過AICore API直接調(diào)用其他Android手機(jī)的Gemini AI能力,將會(huì)遇到與Pixel 8相同的硬件要求問題。

在雷科技看來,Google之所以限制Pixel 8調(diào)用Gemini Nano模型,一方面是擔(dān)心Gemini Nano模型在占用大量手機(jī)系統(tǒng)內(nèi)存后,影響用戶使用其他應(yīng)用程序時(shí)的體驗(yàn)感,為了保險(xiǎn)起見,干脆直接一刀切;另一方面,Pixel 8標(biāo)準(zhǔn)版與Pixel 8 Pro標(biāo)準(zhǔn)版的售價(jià)相差大約2000元,在核心配置相差不大的情況下,AI功能或許能驅(qū)使目標(biāo)用戶選擇更貴的Pixel 8 Pro。

內(nèi)存壓縮技術(shù),是端側(cè)大模型的必經(jīng)之路?

我們暫且不討論運(yùn)行內(nèi)存對端側(cè)大模型的影響是否真的有那么大,站在行業(yè)角度,如何在算力有限的手機(jī)上實(shí)現(xiàn)較好的大模型效果,是所有手機(jī)廠商都需要考慮的問題。

此前微軟推出的Copilot Pro訂閱服務(wù)對AI PC的算力和內(nèi)存提出了明確要求,但在AI手機(jī)領(lǐng)域,至今還沒有任何一家企業(yè)給出大模型手機(jī)的類似標(biāo)準(zhǔn)。

或許大部分人都不知道,其實(shí)最早被曝出規(guī)劃手機(jī)端側(cè)路線的企業(yè),是至今仍未在iPhone用上大模型的蘋果。蘋果在招聘介紹中提及了本地推理引擎中實(shí)現(xiàn)壓縮和加速大模型的相關(guān)要求,雖然iOS 18還未正式推出,但蘋果對AI大模型的探索從其取得的專利就能窺見一二。

日前,蘋果研究團(tuán)隊(duì)發(fā)表了一篇關(guān)于「如何解決大模型手機(jī)內(nèi)存不足」的論文。簡單來說,研究團(tuán)隊(duì)嘗試用閃存技術(shù)減少數(shù)據(jù)加載,并且優(yōu)化數(shù)據(jù)塊大小提高閃存吞吐量,最后實(shí)現(xiàn)對加載到內(nèi)存中數(shù)據(jù)的高效管理。

毫無疑問,這是解決端側(cè)部署大模型關(guān)鍵問題的可行方案。整個(gè)過程的重點(diǎn)是優(yōu)化閃存交互和內(nèi)存管理,在實(shí)驗(yàn)過程中,運(yùn)用閃存技術(shù)的大模型延遲毫秒僅為原來的1/10。但論文提供方案僅針對60億-70億參數(shù)的模型,暫時(shí)無法完美處理超出參數(shù)范圍的大模型。不過該方案給所有廠商提供了一個(gè)全新思路,未來完全有可能通過閃存技術(shù)解決端側(cè)大模型內(nèi)存不足的問題。

除了存儲(chǔ)技術(shù)外,芯片廠商也從自身角度給出了可行的解決方案。2023年11月,聯(lián)發(fā)科發(fā)布了號(hào)稱「生成式AI移動(dòng)芯片」的新一代旗艦SoC——天璣9300。針對億級(jí)參數(shù)級(jí)別的大模型,天璣9300采用內(nèi)存壓縮技術(shù)「NeuroPilot Compression」,據(jù)官方介紹,該技術(shù)可以更高效地利用內(nèi)存,大幅減少AI大模型對設(shè)備內(nèi)存的占用,最高支持運(yùn)行330億參數(shù)的AI大模型。

目前,vivo X100、OPPO Find X7、iQOO Neo9 Pro等機(jī)型均搭載了天璣9300處理器。其中聯(lián)發(fā)科與vivo合作,已經(jīng)實(shí)現(xiàn)了10億、70億、130億參數(shù)的AI大語言模型的運(yùn)行,此外,天璣9300還成功集成了通義千問大模型。

相比起云端,端側(cè)的運(yùn)行特性無疑更容易令消費(fèi)者放心。要提升端側(cè)大模型的實(shí)際表現(xiàn),離不開手機(jī)廠商和硬件廠商的共同努力,閃存技術(shù)和內(nèi)存壓縮技術(shù)能有效解決大模型占用內(nèi)存的問題,未來估計(jì)會(huì)被更多品牌采用。

為大模型鋪路,大內(nèi)存手機(jī)將加速普及

端側(cè)大模型占手機(jī)內(nèi)存,用戶怎么辦?其實(shí)這是一個(gè)“想要什么”的問題。如果為了享受大模型功能,則需放棄手機(jī)原有的部分體驗(yàn),現(xiàn)階段絕大多數(shù)AI大模型其實(shí)并沒有多少真正實(shí)用的功能,大多數(shù)手機(jī)用戶充其量只是嘗嘗鮮,如果非要在非必須功能與手機(jī)體驗(yàn)之間進(jìn)行二選一,相信選擇手機(jī)體驗(yàn)的用戶還是占大多數(shù)。

面對無法從根源解決大模型占用內(nèi)存問題的情況,大內(nèi)存就會(huì)成為用機(jī)體驗(yàn)和AI大模型功能兼顧的第二道保障。當(dāng)前安卓手機(jī)的最低內(nèi)存配置普遍為8GB,最高內(nèi)存容量已經(jīng)來到24GB,主流旗艦機(jī)型基本以12GB和16GB內(nèi)存為主。如果以Google Pixel 8 Pro的12GB內(nèi)存作為當(dāng)前運(yùn)行端側(cè)大模型的內(nèi)存標(biāo)準(zhǔn),那么絕大多數(shù)手機(jī)品牌的主流旗艦還是過關(guān)的。

實(shí)際上,內(nèi)存占用最多只能算是大模型進(jìn)步過程中遇到的技術(shù)難題,只要繼續(xù)發(fā)展相信這類問題終究會(huì)迎刃而解。但無論是端側(cè)還是云端,大模型手機(jī)最需要搞清楚的核心問題仍是「用戶是否真的需要大模型」。

大模型手機(jī)作為去年手機(jī)行業(yè)最熱門的技術(shù)方向,幾乎每家手機(jī)品牌的技術(shù)展會(huì)以及發(fā)布會(huì)都會(huì)提及相關(guān)技術(shù)。但在門店等線下渠道,雷科技卻很少看到有品牌會(huì)將大模型放置在海報(bào)、卡片等宣傳物料上。誠然,線下渠道確實(shí)不太好展示大模型的相關(guān)功能,但也能一定程度上反映出手機(jī)廠商們對當(dāng)前大模型手機(jī)的態(tài)度,或許他們也清楚現(xiàn)階段的大模型功能還很難在線下場景直接影響消費(fèi)者購物。

大模型手機(jī)的技術(shù)水平仍處于初期發(fā)展階段,手機(jī)廠商還在不斷探索大模型與智能手機(jī)的結(jié)合??梢赃@么說:大模型能為智能手機(jī)帶來的潛在價(jià)值,不亞于功能機(jī)到智能機(jī)的更替。至于大模型手機(jī)是否真的成為跟智能手機(jī)平行的新物種?不如讓我們將答案交給時(shí)間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

谷歌

5.6k
  • 谷歌在芬蘭購地,推進(jìn)云計(jì)算和數(shù)據(jù)基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃
  • 谷歌回應(yīng)加拿大反壟斷機(jī)構(gòu)起訴:期待在法庭上陳述觀點(diǎn)

小米

7.6k
  • 小米汽車:11月小米SU7交付量超20000臺(tái)
  • 南向資金今日凈買入78.1億港元,小米集團(tuán)凈賣出額居首

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

當(dāng)AI手機(jī)遭遇內(nèi)存限制,谷歌Pixel 8“一刀切”不可???

內(nèi)存不足是AI大模型手機(jī)的攔路虎。

文|雷科技

2023年10月4日,Google在紐約舉辦了「Made by Google」硬件發(fā)布會(huì),并正式發(fā)布了Pixel 8和Pixel 8 Pro。Pixel 8系列作為首批搭載Android 14系統(tǒng)的手機(jī),據(jù)官方介紹其最大亮點(diǎn)就是AI功能。在發(fā)布會(huì)持續(xù)的一小時(shí)內(nèi),「AI」一詞被提及超過50次,可見Google對這一功能的重視,以及AI是Pixel 8核心賣點(diǎn)的事實(shí)。

然而讓人意外的是,日前Google以「硬件限制」為理由,拒絕在Pixel 8上運(yùn)行最新的人工智能模型「Gemini Nano」。Google隨后宣布即將在6月的季度更新中為Pixel 8提供「Gemini Nano」功能,但用戶只能在隱藏的開發(fā)者選項(xiàng)中開啟。

對于此事,谷歌設(shè)備和服務(wù)軟件副總裁Seang Chau解釋稱,為了能隨時(shí)調(diào)用「Gemini Nano」模型,部分AI模型會(huì)常駐內(nèi)存。而Pixel 8只有8GB內(nèi)存,如果貿(mào)然啟用「Gemini Nano」功能,很可能會(huì)影響用戶的使用體驗(yàn)。與之相反,Pixel 8 Pro擁有12GB內(nèi)存,能比較好地釋放AI模型性能。

從Seang Chau的回復(fù)來看,Pixel 8并不是不能使用「Gemini Nano」,而是使用后會(huì)占用大量手機(jī)系統(tǒng)內(nèi)存,導(dǎo)致其他應(yīng)用的體驗(yàn)感下降。作為參考,三星Galaxy S24系列8GB內(nèi)存版本就可運(yùn)行Gemini Nano模型,而沒有這方面的限制。

“一刀切”能否克服端側(cè)大模型劣勢?

目前,大模型已經(jīng)成為手機(jī)廠商們的「必爭之地」,小米、華為、榮耀、OPPO、vivo等手機(jī)廠商均已發(fā)布搭載大模型的旗艦機(jī)型。像華為的盤古大模型、小米的MiLM、OPPO的安第斯大模型、vivo的藍(lán)心大模型以及榮耀的魔法大模型,也隨著新機(jī)發(fā)布首次走進(jìn)消費(fèi)者的視野。在以上大模型解決方案中,有以云端為主的,也有云端與端側(cè)相結(jié)合的,但幾乎沒有純端側(cè)的大模型。

所謂的「端側(cè)」,指的是將大模型服務(wù)布置在手機(jī)設(shè)備內(nèi)部的芯片之中,僅利用芯片的算力生成結(jié)果。與云端大模型相比,這種方案的優(yōu)勢是不需要聯(lián)網(wǎng),因此數(shù)據(jù)不用上傳至云端,減少了泄露風(fēng)險(xiǎn),并在一定程度上減輕了云成本。

但純端側(cè)方案也有其不可忽視的劣勢,就是算力有限。如果手機(jī)設(shè)備只是接入云端大模型,自然不需要終端設(shè)備擁有多強(qiáng)的算力和AI芯片,但如果在手機(jī)本地運(yùn)營端側(cè)大模型,則對算力有著極高的要求。盡管從理論上來說,常規(guī)手機(jī)芯片中的GPU、CPU都能進(jìn)行并行計(jì)算,但在效率和能耗控制方面仍比不上AI芯片中專門用于AI加速計(jì)算的NPU/TPU等神經(jīng)處理單元,更別提動(dòng)輒擁有幾百上千張頂級(jí)顯卡的云端后臺(tái)了。

而Google的「Gemini Nano」在發(fā)布之初,就已經(jīng)將其定位為在移動(dòng)設(shè)備上本地運(yùn)行的端側(cè)大模型,并且其內(nèi)置在Android 14系統(tǒng)中。也就是說,未來如果其他開發(fā)者想通過AICore API直接調(diào)用其他Android手機(jī)的Gemini AI能力,將會(huì)遇到與Pixel 8相同的硬件要求問題。

在雷科技看來,Google之所以限制Pixel 8調(diào)用Gemini Nano模型,一方面是擔(dān)心Gemini Nano模型在占用大量手機(jī)系統(tǒng)內(nèi)存后,影響用戶使用其他應(yīng)用程序時(shí)的體驗(yàn)感,為了保險(xiǎn)起見,干脆直接一刀切;另一方面,Pixel 8標(biāo)準(zhǔn)版與Pixel 8 Pro標(biāo)準(zhǔn)版的售價(jià)相差大約2000元,在核心配置相差不大的情況下,AI功能或許能驅(qū)使目標(biāo)用戶選擇更貴的Pixel 8 Pro。

內(nèi)存壓縮技術(shù),是端側(cè)大模型的必經(jīng)之路?

我們暫且不討論運(yùn)行內(nèi)存對端側(cè)大模型的影響是否真的有那么大,站在行業(yè)角度,如何在算力有限的手機(jī)上實(shí)現(xiàn)較好的大模型效果,是所有手機(jī)廠商都需要考慮的問題。

此前微軟推出的Copilot Pro訂閱服務(wù)對AI PC的算力和內(nèi)存提出了明確要求,但在AI手機(jī)領(lǐng)域,至今還沒有任何一家企業(yè)給出大模型手機(jī)的類似標(biāo)準(zhǔn)。

或許大部分人都不知道,其實(shí)最早被曝出規(guī)劃手機(jī)端側(cè)路線的企業(yè),是至今仍未在iPhone用上大模型的蘋果。蘋果在招聘介紹中提及了本地推理引擎中實(shí)現(xiàn)壓縮和加速大模型的相關(guān)要求,雖然iOS 18還未正式推出,但蘋果對AI大模型的探索從其取得的專利就能窺見一二。

日前,蘋果研究團(tuán)隊(duì)發(fā)表了一篇關(guān)于「如何解決大模型手機(jī)內(nèi)存不足」的論文。簡單來說,研究團(tuán)隊(duì)嘗試用閃存技術(shù)減少數(shù)據(jù)加載,并且優(yōu)化數(shù)據(jù)塊大小提高閃存吞吐量,最后實(shí)現(xiàn)對加載到內(nèi)存中數(shù)據(jù)的高效管理。

毫無疑問,這是解決端側(cè)部署大模型關(guān)鍵問題的可行方案。整個(gè)過程的重點(diǎn)是優(yōu)化閃存交互和內(nèi)存管理,在實(shí)驗(yàn)過程中,運(yùn)用閃存技術(shù)的大模型延遲毫秒僅為原來的1/10。但論文提供方案僅針對60億-70億參數(shù)的模型,暫時(shí)無法完美處理超出參數(shù)范圍的大模型。不過該方案給所有廠商提供了一個(gè)全新思路,未來完全有可能通過閃存技術(shù)解決端側(cè)大模型內(nèi)存不足的問題。

除了存儲(chǔ)技術(shù)外,芯片廠商也從自身角度給出了可行的解決方案。2023年11月,聯(lián)發(fā)科發(fā)布了號(hào)稱「生成式AI移動(dòng)芯片」的新一代旗艦SoC——天璣9300。針對億級(jí)參數(shù)級(jí)別的大模型,天璣9300采用內(nèi)存壓縮技術(shù)「NeuroPilot Compression」,據(jù)官方介紹,該技術(shù)可以更高效地利用內(nèi)存,大幅減少AI大模型對設(shè)備內(nèi)存的占用,最高支持運(yùn)行330億參數(shù)的AI大模型。

目前,vivo X100、OPPO Find X7、iQOO Neo9 Pro等機(jī)型均搭載了天璣9300處理器。其中聯(lián)發(fā)科與vivo合作,已經(jīng)實(shí)現(xiàn)了10億、70億、130億參數(shù)的AI大語言模型的運(yùn)行,此外,天璣9300還成功集成了通義千問大模型。

相比起云端,端側(cè)的運(yùn)行特性無疑更容易令消費(fèi)者放心。要提升端側(cè)大模型的實(shí)際表現(xiàn),離不開手機(jī)廠商和硬件廠商的共同努力,閃存技術(shù)和內(nèi)存壓縮技術(shù)能有效解決大模型占用內(nèi)存的問題,未來估計(jì)會(huì)被更多品牌采用。

為大模型鋪路,大內(nèi)存手機(jī)將加速普及

端側(cè)大模型占手機(jī)內(nèi)存,用戶怎么辦?其實(shí)這是一個(gè)“想要什么”的問題。如果為了享受大模型功能,則需放棄手機(jī)原有的部分體驗(yàn),現(xiàn)階段絕大多數(shù)AI大模型其實(shí)并沒有多少真正實(shí)用的功能,大多數(shù)手機(jī)用戶充其量只是嘗嘗鮮,如果非要在非必須功能與手機(jī)體驗(yàn)之間進(jìn)行二選一,相信選擇手機(jī)體驗(yàn)的用戶還是占大多數(shù)。

面對無法從根源解決大模型占用內(nèi)存問題的情況,大內(nèi)存就會(huì)成為用機(jī)體驗(yàn)和AI大模型功能兼顧的第二道保障。當(dāng)前安卓手機(jī)的最低內(nèi)存配置普遍為8GB,最高內(nèi)存容量已經(jīng)來到24GB,主流旗艦機(jī)型基本以12GB和16GB內(nèi)存為主。如果以Google Pixel 8 Pro的12GB內(nèi)存作為當(dāng)前運(yùn)行端側(cè)大模型的內(nèi)存標(biāo)準(zhǔn),那么絕大多數(shù)手機(jī)品牌的主流旗艦還是過關(guān)的。

實(shí)際上,內(nèi)存占用最多只能算是大模型進(jìn)步過程中遇到的技術(shù)難題,只要繼續(xù)發(fā)展相信這類問題終究會(huì)迎刃而解。但無論是端側(cè)還是云端,大模型手機(jī)最需要搞清楚的核心問題仍是「用戶是否真的需要大模型」。

大模型手機(jī)作為去年手機(jī)行業(yè)最熱門的技術(shù)方向,幾乎每家手機(jī)品牌的技術(shù)展會(huì)以及發(fā)布會(huì)都會(huì)提及相關(guān)技術(shù)。但在門店等線下渠道,雷科技卻很少看到有品牌會(huì)將大模型放置在海報(bào)、卡片等宣傳物料上。誠然,線下渠道確實(shí)不太好展示大模型的相關(guān)功能,但也能一定程度上反映出手機(jī)廠商們對當(dāng)前大模型手機(jī)的態(tài)度,或許他們也清楚現(xiàn)階段的大模型功能還很難在線下場景直接影響消費(fèi)者購物。

大模型手機(jī)的技術(shù)水平仍處于初期發(fā)展階段,手機(jī)廠商還在不斷探索大模型與智能手機(jī)的結(jié)合??梢赃@么說:大模型能為智能手機(jī)帶來的潛在價(jià)值,不亞于功能機(jī)到智能機(jī)的更替。至于大模型手機(jī)是否真的成為跟智能手機(jī)平行的新物種?不如讓我們將答案交給時(shí)間。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。