文|讀懂財(cái)經(jīng)
2022年底,ChatGPT 的出世,讓“大模型”成為全球科技領(lǐng)域的關(guān)鍵詞。整個(gè)2023年,所有模型玩家都在以 GPT-4 作為目標(biāo)進(jìn)行追趕。原因很簡單,在這場先發(fā)制人的游戲里,推理能力被認(rèn)為是唯一的衡量標(biāo)準(zhǔn)。
全球所有的科技公司里,蘋果無疑是個(gè)“另類”。在目前所有的主流智能手機(jī)廠商乃至全球科技公司里,蘋果是唯一一家還沒有正式發(fā)布大模型產(chǎn)品的廠商,甚至都很少正面提及。就連馬斯克在去年7月成立的人工智能公司xAI,馬上就要發(fā)布首個(gè)AI大模型Grok 1.5。
而在已披露蘋果大模型進(jìn)展的有限信息里,蘋果給人一種感覺:相比其他科技公司,蘋果并不追求大模型性能的絕對領(lǐng)先,而是更看重大模型落地的可能性。
我們應(yīng)該如何理解蘋果在大模型上的“遲鈍”?選擇“務(wù)實(shí)”路線的蘋果,又會在大模型故事里扮演怎樣的角色?
01 雙面“蘋果”
去年的大模型風(fēng)潮中,手機(jī)廠商成為一股不可或缺的“力量”。
2023年,華為發(fā)布了盤古大模型,并率先將大模型接入手機(jī);vivo則推出了主打輕量化的藍(lán)心大模型;三星也公布了其自研的生成式人工智能模型“三星高斯”,并在今年推出了旗下首款A(yù)I手機(jī)Galaxy S24系列手機(jī)。
唯獨(dú)蘋果是個(gè)例外。作為全球最大的科技公司,蘋果在去年對這項(xiàng)過去十年中最重要的科技發(fā)展——生成式人工智能,很少正面提及。
在一季報(bào)的電話會議上,蘋果CEO庫克只是輕描淡寫地表示,蘋果會將AI應(yīng)用到更多產(chǎn)品上,但要深思熟慮。甚至在6月的開發(fā)者大會WWDC上,蘋果對人工智能和大模型更是只字未提,只是簡單提到了“機(jī)器學(xué)習(xí)”這個(gè)詞語。
在目前所有的主流智能手機(jī)廠商乃至全球科技公司里,蘋果是唯一一家還沒有正式發(fā)布大模型產(chǎn)品的廠商。就連馬斯克在去年7月成立的人工智能公司xAI,就要發(fā)布首個(gè)AI大模型Grok 1.5。
看上去,蘋果似乎“缺席”了這場大模型的賽跑。但事實(shí)可能并非如此。
種種跡象顯示,蘋果在AI領(lǐng)域的布局比我們想象得要更深。據(jù)彭博社報(bào)道,2023 年 7 月,蘋果建立了自己的大型語言模型 Ajax,并推出代號為「Apple GPT」的內(nèi)部聊天機(jī)器人,用于測試 Ajax 的功能。
據(jù)知情人士分析,Ajax GPT的訓(xùn)練參數(shù)數(shù)量超過2000億。參數(shù)反映了機(jī)器學(xué)習(xí)模型的規(guī)模和復(fù)雜程度;參數(shù)數(shù)量越多,表示復(fù)雜程度越高,需要的存儲空間和計(jì)算能力也越大。要知道,GPT-3.5的訓(xùn)練參數(shù)規(guī)模在1750億,也就是說,如今的Ajax GPT或許在功能上比OpenAI的GPT-3.5更強(qiáng)。
從投入規(guī)模上看,Ajax GPT所在的生成式AI項(xiàng)目每年將花費(fèi)蘋果約 10 億美元。另外,根據(jù)The Information報(bào)道,如今蘋果公司將把訓(xùn)練最先進(jìn)模型的預(yù)算增加到每天數(shù)百萬美元,而這只是對開發(fā)其中一種模型的投入。
與很多人印象不同,蘋果還是最熱衷于投資AI的科技公司。自2010年以來,在FAMGA的公司中,蘋果共收購了20家AI公司,位列第一。同期,谷歌和微軟分別收購了14家和10家。
更加有趣的事情是,在投入研發(fā)大模型的同時(shí),蘋果還花了相當(dāng)大的精力去探索大模型落地的可能性。
02 押注端側(cè)大模型
今年下半年以來,AI硬件是所有科技公司共同發(fā)力的方向。在真正“AI-native 硬件”誕生之前,把 LLM 和現(xiàn)有終端融合更具有落地可能性。手機(jī)、PC、車車等硬件廠商都有極大動力去落地大模型,這其中以手機(jī)廠商最為激進(jìn)。
但遺憾的是,到目前為止,大模型與現(xiàn)有智能硬件之間的融合并不流暢。
就拿手機(jī)來說,受限于手機(jī)內(nèi)存的運(yùn)存處理能力限制,大模型還無法被搬到手機(jī)上。聯(lián)發(fā)科就曾透露,130億參數(shù)大模型至少需要13GB內(nèi)存,再加上6GB App保活、4GB安卓OS,即總的手機(jī)內(nèi)存容量需求將達(dá)到23GB。
23GB手機(jī)內(nèi)存是個(gè)什么概念呢?去年上市最新的iPhone 15的運(yùn)行內(nèi)存大小只有6GB,iPhone15 Pro 和 iPhone15 Pro Max 運(yùn)行內(nèi)存也只有8GB。這意味著,想要在手機(jī)上提升跑大模型,內(nèi)存容量必須有大幅度提升。
所以,目前大多數(shù)大模型都是在云端運(yùn)營,固然參數(shù)規(guī)模更大、算力更高等優(yōu)勢,但缺點(diǎn)也很明顯。當(dāng)用戶在弱網(wǎng)乃至離網(wǎng)環(huán)境下,無法使用大模型功能,甚至還有用戶隱私安全泄露的風(fēng)險(xiǎn)。這對極為重視用戶體驗(yàn)的蘋果來說,是無法接受的。
而蘋果就是端側(cè)大模型的堅(jiān)定支持者。多位前蘋果機(jī)器學(xué)習(xí)工程師稱,出于提高隱私和性能的考慮,蘋果的領(lǐng)導(dǎo)層更傾向于在設(shè)備上運(yùn)行大模型,而不是在云服務(wù)器上。
要想落地落地端側(cè)大模型,除了內(nèi)存容量提升,模型本身的壓縮和優(yōu)化也是落地大模型的一種方式。前者顧名思義就是壓縮模型的規(guī)模,讓模型更注重關(guān)鍵場景的精度和效果;后者則是通過技術(shù)手段對模型進(jìn)行優(yōu)化,通過內(nèi)存管理減少內(nèi)存搬運(yùn),進(jìn)而降低功耗。
目前,大部分科技公司把更多精力放到訓(xùn)練參數(shù)更少、體量更小的“小模型”。去年12月,微軟正式發(fā)布了參數(shù)規(guī)模僅有27億的“小模型”Phi-2,并宣稱該模型性能夠“吊打”體量在其25倍以上的大模型。
但蘋果卻另辟蹊徑,選擇了后者。此前,蘋果發(fā)布的論文顯示,它嘗試?yán)瞄W存來解決大模型在塞進(jìn)手機(jī)時(shí)遇到的內(nèi)存不足的問題。簡單來說,蘋果就做了兩件事情,優(yōu)化閃存交互和內(nèi)存管理。
說起來,計(jì)算機(jī)的各種硬件設(shè)備和我們?nèi)祟惖能|體非常相似,計(jì)算機(jī)的 CPU 好比人類的大腦,其中也有用來存放程序和數(shù)據(jù)的記憶裝置,相當(dāng)于我們腦袋中的記憶體。
計(jì)算機(jī)的記憶體簡單分為內(nèi)存和閃存兩種。內(nèi)存用于臨時(shí)存儲那些需要隨時(shí)訪問的數(shù)據(jù)和指令,它提供高速的讀寫,有較高的存儲密度。而閃存正相反,它讀寫較慢,適用于長期數(shù)據(jù)的存儲。從特性上看,內(nèi)存更適合需要頻繁讀寫的大模型。但正如上文所說,內(nèi)存現(xiàn)階段性能不夠,僅憑它一個(gè)撐不起大模型。
而蘋果的做法是,允許模型重復(fù)使用部分已處理的數(shù)據(jù),從而減少頻繁讀取內(nèi)存的需要,提高大模型運(yùn)行效率;二是通過對數(shù)據(jù)進(jìn)行更有效的分組,令大模型能夠更快地從閃存中讀取數(shù)據(jù),從而加速AI 理解和生成語言的能力。
通過這一方式,蘋果可以運(yùn)行比設(shè)備DRAM容量大兩倍的模型,并在CPU和GPU上分別比傳統(tǒng)方法提速4-5倍和20-25倍。用研究人員的話說,這為在內(nèi)存有限的設(shè)備上有效推理 LLM 鋪平了道路。
作為一個(gè)硬件公司,蘋果更注重于技術(shù)落地本身沒有什么太大問題。但如果把其視作是一家科技公司,蘋果就多少顯得有些“另類”。
03 科技公司里的“實(shí)用主義者”
幾乎在所有人的邏輯里,大模型是一場先發(fā)制人的游戲,推理能力是唯一的衡量標(biāo)準(zhǔn)。甚至在很多人看來,模型競賽相當(dāng)殘酷,類似芯片或 SpaceX,因?yàn)轭I(lǐng)先的模型能力又強(qiáng)又便宜,后面的玩家會很難存活。
但蘋果對這個(gè)游戲的理解并非如此。一個(gè)更接近真相的解釋是:相比其他科技公司,蘋果并不追求大模型性能的絕對領(lǐng)先,而是更看重大模型落地的可能性。
這與蘋果長期以來的“實(shí)用主義”理念有很大關(guān)系。蘋果實(shí)用主義的精髓在于,其并不追求絕對的技術(shù)領(lǐng)先,而更擅長在技術(shù)向產(chǎn)品大規(guī)模轉(zhuǎn)化過程中,通過其獨(dú)特的產(chǎn)品能力,實(shí)現(xiàn)對同類產(chǎn)品的超越。
從過去看,智能手機(jī)是由IBM公司的工程師Theodore Paraskevakos發(fā)明的,但卻在蘋果手里發(fā)揚(yáng)光大;在初代iPod發(fā)布時(shí),MP3播放器已經(jīng)是一個(gè)個(gè)非常成熟的品類,可最后蘋果還是贏了。在更擅長賺錢的庫克上任后,蘋果的實(shí)用主義得到更充分的踐行。
這也體現(xiàn)蘋果在AI領(lǐng)域的布局。相比谷歌的動輒上億美元的大手筆,蘋果雖然并購數(shù)量多,但整體金額都不大。它們更愿意收購一些小型公司,借助其團(tuán)隊(duì)和技術(shù)為蘋果自身未來的產(chǎn)品增加新功能。比如,iPhone X的FaceID就源自蘋果在芯片和計(jì)算機(jī)視覺領(lǐng)域的一系列并購行動。
沿著這個(gè)邏輯,也就不難理解蘋果為何遲遲不公布其大模型產(chǎn)品。因?yàn)榈侥壳盀橹梗竽P瓦h(yuǎn)大愿景與尚不清晰的商業(yè)化前景之間仍然需要無數(shù)的產(chǎn)品去填。
盡管目前已經(jīng)出現(xiàn)ChatGPT、Character.AI 等超級應(yīng)用,但上述應(yīng)用的調(diào)用入口十分單一,功能也多集中在內(nèi)容生產(chǎn)方面,仍然有很大提升空間。一個(gè)顯著的體現(xiàn)是,這些應(yīng)用在用戶活躍度上起伏很大。比如在經(jīng)歷去年年初的瘋狂后,ChatGPT日活在去年下半年出現(xiàn)了明顯的回撤。
更重要的是,相比功能相對單一,大模型落地所要付出的成本與商業(yè)化回報(bào)之間不成正比。目前,AI應(yīng)用商業(yè)化手段還很單一,難以支撐其高昂的運(yùn)行成本。
按照Open AI公布的GPT-4的API費(fèi)用表,為每輸入1000個(gè)字符(約合750個(gè)單詞),價(jià)格為0.03美元,每生成1000個(gè)字符,價(jià)格為0.06美元。也就是說用戶每問一次,成本差不多就是1毛錢??紤]到蘋果全球僅 iPhone 用戶就超過十億,意味著大模型運(yùn)行的成本將極其高昂。
退一步講,如果仍然是這個(gè)路子,無論哪家廠商最終“贏了”,他們的產(chǎn)品或者服務(wù)都會極大概率以“App”的形式出現(xiàn)在蘋果的App Store里,為全球的蘋果用戶提供服務(wù)。
蘋果看似務(wù)實(shí)的做法并非沒有一絲隱患。目前,市場對于AI硬件的發(fā)展大致有兩種觀點(diǎn):
一種觀點(diǎn)是基于大模型的自然語言交互能力需要一個(gè)新硬件。無論是去年發(fā)布的AI Pin,還是不久前在CES上亮相的Rabbit R1,都屬于這一類產(chǎn)品。這類產(chǎn)品的特點(diǎn)是最大化利用了AI的文本理解、生成、翻譯能力、特別是圖片、音視頻等多模態(tài)能力,幾乎做到無縫銜接,融于無形。
另一種觀點(diǎn)是手機(jī)就是大模型最好的硬件載體,這也是蘋果所相信的方向。所以,我們能看到,蘋果將更多精力投入了新硬件產(chǎn)品的研發(fā)——Vision Pro,而非AI硬件。
路線差異背后,意味著一旦踏錯(cuò),蘋果幾乎就完全要依賴產(chǎn)品能力進(jìn)行追趕。但近年來,蘋果所引以為傲后發(fā)至上的產(chǎn)品能力卻頻頻失效。
盡管經(jīng)歷了漫長的7年研發(fā),Vision Pro最終上市,但距離庫克的最初設(shè)想相繼甚遠(yuǎn);而在造車這事上,蘋果也與最初的夢想漸行漸遠(yuǎn)。根據(jù)此前的報(bào)道,蘋果的首款汽車放棄了 L5 全自動駕駛路線,方向盤、剎車和油門踏板等傳統(tǒng)汽車該有的硬件都會保留,售價(jià)調(diào)低至 10 萬美元以下,量產(chǎn)時(shí)間再推遲到 2026 年。這意味著,蘋果基本已經(jīng)退出新能源汽車的競爭。
毫無疑問,大模型時(shí)代的硬件會重復(fù)計(jì)算機(jī)的老路:就是從算力集中于超算等大型設(shè)備上到算力一步步轉(zhuǎn)移至屬于個(gè)人終端。只是“實(shí)用主義者”蘋果,最終會在這個(gè)故事里扮演怎樣的角色,仍然要打一個(gè)大大的問號。