文|烏鴉智能說
今天凌晨,蘋果開了一個短短12分鐘的會議,會議的內(nèi)容很簡單,無非八個字:放棄造車,發(fā)力AI。
路透社援引內(nèi)部消息人士透露,蘋果公司已擱置并取消了自動駕駛電動汽車的所有開發(fā)計劃,意味著這個長達十余年、投入數(shù)十億美元,也是蘋果歷史上最雄心勃勃的項目,卻在一個沒有回答任何問題的12分鐘簡短會議上結(jié)束。
與此同時,蘋果又做了重大決定:轉(zhuǎn)向生成式人工智能。汽車團隊(即特殊項目團隊,簡稱SPG)的眾多成員將被調(diào)往人工智能部門,由高管約翰·詹南德里亞(John Giannandrea)領(lǐng)導(dǎo)。這是一個明確且極為重要的信號:蘋果要加速發(fā)力生成式AI了。
在過去相當(dāng)長時間里,蘋果都因為在這場生成式AI派對上顯得遲疑而受到猛烈抨擊。
在目前所有的主流智能手機廠商乃至全球科技公司里,蘋果是唯一一家還沒有正式發(fā)布大模型產(chǎn)品的廠商,甚至都很少正面提及。就連馬斯克在去年7月成立的人工智能公司xAI,馬上就要發(fā)布首個AI大模型Grok 1.5。
而在已披露蘋果大模型進展的有限信息里,蘋果給人一種感覺:相比其他科技公司,蘋果并不追求大模型性能的絕對領(lǐng)先,而是更看重大模型落地的可能性。
考慮到生成式AI是一場先發(fā)制人的游戲,蘋果在大模型上的“遲鈍“與”務(wù)實“,或許會為其在未來競爭中埋下隱患。
/ 01 / 遲到的蘋果
由于電動汽車市場降溫、競爭激烈等因素影響,蘋果放棄造車本就在情理之中,只是時間問題。但讓人不理解的是,蘋果在生成式AI上的“遲鈍“。
去年的大模型風(fēng)潮中,手機廠商成為一股不可或缺的“力量”。
2023年,華為發(fā)布了盤古大模型,并率先將大模型接入手機;vivo則推出了主打輕量化的藍心大模型;三星也公布了其自研的生成式人工智能模型“三星高斯”,并在今年推出了旗下首款A(yù)I手機Galaxy S24系列手機。
唯獨蘋果是個例外。作為全球最大的科技公司,蘋果在去年對這項過去十年中最重要的科技發(fā)展——生成式人工智能,很少正面提及。
在一季報的電話會議上,蘋果CEO庫克只是輕描淡寫地表示,蘋果會將AI應(yīng)用到更多產(chǎn)品上,但要深思熟慮。甚至在6月的開發(fā)者大會WWDC上,蘋果對人工智能和大模型更是只字未提,只是簡單提到了“機器學(xué)習(xí)”這個詞語。?
在目前所有的主流智能手機廠商乃至全球科技公司里,蘋果是唯一一家還沒有正式發(fā)布大模型產(chǎn)品的廠商。就連馬斯克在去年7月成立的人工智能公司xAI,就要發(fā)布首個AI大模型Grok 1.5。
看上去,蘋果似乎“缺席”了這場大模型的賽跑。但事實可能并非如此。
種種跡象顯示,蘋果在AI領(lǐng)域的布局比我們想象得要更深。據(jù)彭博社報道,2023 年 7 月,蘋果建立了自己的大型語言模型 Ajax,并推出代號為「Apple GPT」的內(nèi)部聊天機器人,用于測試 Ajax 的功能。
據(jù)知情人士分析,Ajax GPT的訓(xùn)練參數(shù)數(shù)量超過2000億。參數(shù)反映了機器學(xué)習(xí)模型的規(guī)模和復(fù)雜程度;參數(shù)數(shù)量越多,表示復(fù)雜程度越高,需要的存儲空間和計算能力也越大。要知道,GPT-3.5的訓(xùn)練參數(shù)規(guī)模在1750億,也就是說,如今的Ajax GPT或許在功能上比OpenAI的GPT-3.5更強。
從投入規(guī)模上看,Ajax GPT所在的生成式AI項目每年將花費蘋果約 10 億美元。另外,根據(jù)The Information報道,如今蘋果公司將把訓(xùn)練最先進模型的預(yù)算增加到每天數(shù)百萬美元,而這只是對開發(fā)其中一種模型的投入。
與很多人印象不同,蘋果還是最熱衷于投資AI的科技公司。自2010年以來,在FAMGA的公司中,蘋果共收購了20家AI公司,位列第一。同期,谷歌和微軟分別收購了14家和10家。
更加有趣的事情是,在投入研發(fā)大模型的同時,蘋果還花了相當(dāng)大的精力去探索大模型落地的可能性。
/ 02 / 押注端側(cè)大模型
今年下半年以來,AI硬件是所有科技公司共同發(fā)力的方向。在真正“AI-native 硬件”誕生之前,把 LLM 和現(xiàn)有終端融合更具有落地可能性。手機、PC、車車等硬件廠商都有極大動力去落地大模型,這其中以手機廠商最為激進。
但遺憾的是,到目前為止,大模型與現(xiàn)有智能硬件之間的融合并不流暢。
就拿手機來說,受限于手機內(nèi)存的運存處理能力限制,大模型還無法被搬到手機上。聯(lián)發(fā)科就曾透露,130億參數(shù)大模型至少需要13GB內(nèi)存,再加上6GB App?;?、4GB安卓OS,即總的手機內(nèi)存容量需求將達到23GB。
23GB手機內(nèi)存是個什么概念呢?去年上市最新的iPhone 15的運行內(nèi)存大小只有6GB,iPhone15 Pro 和 iPhone15 Pro Max 運行內(nèi)存也只有8GB。這意味著,想要在手機上提升跑大模型,內(nèi)存容量必須有大幅度提升。
所以,目前大多數(shù)大模型都是在云端運營,固然參數(shù)規(guī)模更大、算力更高等優(yōu)勢,但缺點也很明顯。當(dāng)用戶在弱網(wǎng)乃至離網(wǎng)環(huán)境下,無法實用大模型功能,甚至還有用戶隱私安全泄露的風(fēng)險。這對極為重視用戶體驗的蘋果來說,是無法接受的。
而蘋果就是端側(cè)大模型的堅定支持者。多位前蘋果機器學(xué)習(xí)工程則師稱,出于提高隱私和性能的考慮,蘋果的領(lǐng)導(dǎo)層更傾向于在設(shè)備上運行大模型,而不是在云服務(wù)器上。
去年8月,蘋果在加州、西雅圖、巴黎、北京等部門已經(jīng)釋放了數(shù)十個崗位,招聘大模型技術(shù)人才,其中尤其是端側(cè)大型模型是重點。招聘信息顯示,蘋果希望將大型機型壓縮到終端中,以便未來iPhone/iPad等核心產(chǎn)品可以直接運行在AIGC技術(shù)上。
要想落地落地端側(cè)大模型,除了內(nèi)存容量提升,模型本身的壓縮和優(yōu)化也是落地大模型的一種方式。前者顧名思義就是壓縮模型的規(guī)模,讓模型更注重關(guān)鍵場景的精度和效果;后者則是通過技術(shù)手段對模型進行優(yōu)化,通過內(nèi)存管理減少內(nèi)存搬運,進而降低功耗。
目前,大部分科技公司把更多精力放到訓(xùn)練參數(shù)更少、體量更小的“小模型”。 去年12月,微軟正式發(fā)布了參數(shù)規(guī)模僅有27億的“小模型”Phi-2,并宣稱該模型性能夠“吊打”體量在其25倍以上的大模型。
但蘋果卻另辟蹊徑,選擇了后者。此前,蘋果發(fā)布的論文顯示,它嘗試利用閃存來解決大模型在塞進手機時遇到的內(nèi)存不足的問題。簡單來說,蘋果就做了兩件事情,優(yōu)化閃存交互和內(nèi)存管理。
說起來,計算機的各種硬件設(shè)備和我們?nèi)祟惖能|體非常相似,計算機的 CPU 好比人類的大腦,其中也有用來存放程序和數(shù)據(jù)的記憶裝置,相當(dāng)于我們腦袋中的記憶體。
計算機的記憶體簡單分為內(nèi)存和閃存兩種。內(nèi)存用于臨時存儲那些需要隨時訪問的數(shù)據(jù)和指令,它提供高速的讀寫,有較高的存儲密度。而閃存正相反,它讀寫較慢,適用于長期數(shù)據(jù)的存儲。從特性上看,內(nèi)存更適合需要頻繁讀寫的大模型。但正如上文所說,內(nèi)存現(xiàn)階段性能不夠,僅憑它一個撐不起大模型。
而蘋果的做法是,允許模型重復(fù)使用部分已處理的數(shù)據(jù),從而減少頻繁讀取內(nèi)存的需要,提高大模型運行效率;二是通過對數(shù)據(jù)進行更有效的分組,令大模型能夠更快地從閃存中讀取數(shù)據(jù),從而加速AI 理解和生成語言的能力。
通過這一方式,蘋果可以運行比設(shè)備DRAM容量大兩倍的模型,并在CPU和GPU上分別比傳統(tǒng)方法提速4-5倍和20-25倍。用研究人員的話說,這為在內(nèi)存有限的設(shè)備上有效推理 LLM 鋪平了道路。
作為一個硬件公司,蘋果更注重于技術(shù)落地本身沒有什么太大問題。但如果把其視作是一家科技公司,蘋果就多少顯得有些“另類”。
/ 03/ 科技公司里的“實用主義者”
幾乎在所有人的邏輯里,大模型是一場先發(fā)制人的游戲,推理能力是唯一的衡量標準。甚至在很多人看來,模型競賽相當(dāng)殘酷,類似芯片或 SpaceX,因為領(lǐng)先的模型能力又強又便宜,后面的玩家會很難存活。
但蘋果對這個游戲的理解并非如此。一個更接近真相的解釋是:相比其他科技公司,蘋果并不追求大模型性能的絕對領(lǐng)先,而是更看重大模型落地的可能性。
這與蘋果長期以來的“實用主義”理念有很大關(guān)系。蘋果實用主義的精髓在于,其并不追求絕對的技術(shù)領(lǐng)先,而更擅長在技術(shù)向產(chǎn)品大規(guī)模轉(zhuǎn)化過程中,通過其獨特的產(chǎn)品能力,實現(xiàn)對同類產(chǎn)品的超越。
從過去看,智能手機是由IBM公司的工程師Theodore Paraskevakos發(fā)明的,但卻在蘋果手里發(fā)揚光大;在初代iPod發(fā)布時,MP3播放器已經(jīng)是一個個非常成熟的品類,可最后蘋果還是贏了。在更擅長賺錢的庫克上任后,蘋果的實用主義得到更充分的踐行。
這也體現(xiàn)蘋果在AI領(lǐng)域的布局。相比谷歌的動輒上億美元的大手筆,蘋果雖然并購數(shù)量多,但整體金額都不大。它們更愿意收購一些小型公司,借助其團隊和技術(shù)為蘋果自身未來的產(chǎn)品增加新功能。比如,iPhone X的FaceID就源自蘋果在芯片和計算機視覺領(lǐng)域的一系列并購行動。
沿著這個邏輯,也就不難理解蘋果為何遲遲不公布其大模型產(chǎn)品。因為到目前為止,大模型遠大愿景與尚不清晰的商業(yè)化前景之間仍然需要無數(shù)的產(chǎn)品去填。
盡管目前已經(jīng)出現(xiàn)ChatGPT、Character.AI 等超級應(yīng)用,但上述應(yīng)用的調(diào)用入口十分單一,功能也多集中在內(nèi)容生產(chǎn)方面,仍然有很大提升空間。一個顯著的體現(xiàn)是,這些應(yīng)用在用戶活躍度上起伏很大。比如在經(jīng)歷去年年初的瘋狂后,ChatGPT日活在去年下半年出現(xiàn)了明顯的回撤。
更重要的是,相比功能相對單一,大模型落地所要付出的成本與商業(yè)化回報之間不成正比。目前,AI應(yīng)用商業(yè)化手段還很單一,難以支撐其高昂的運行成本。
按照Open AI公布的GPT-4的API費用表,為每輸入1000個字符(約合750個單詞),價格為0.03美元,每生成1000個字符,價格為0.06美元。也就是說用戶每問一次,成本差不多就是1毛錢??紤]到蘋果全球僅 iPhone 用戶就超過十億,意味著大模型運行的成本將極其高昂。
退一步講,如果仍然是這個路子,無論哪家廠商最終“贏了”,他們的產(chǎn)品或者服務(wù)都會極大概率以“App”的形式出現(xiàn)在蘋果的App Store里,為全球的蘋果用戶提供服務(wù)。
蘋果看似務(wù)實的做法并非沒有一絲隱患。目前,市場對于AI硬件的發(fā)展大致有兩種觀點:
一種觀點是基于大模型的自然語言交互能力需要一個新硬件。無論是去年發(fā)布的AI Pin,還是不久前在CES上亮相的Rabbit R1,都屬于這一類產(chǎn)品。這類產(chǎn)品的特點是最大化利用了AI的文本理解、生成、翻譯能力、特別是圖片、音視頻等多模態(tài)能力,幾乎做到無縫銜接,融于無形。
另一種觀點是手機就是大模型最好的硬件載體,這也是蘋果所相信的方向。所以,我們能看到,蘋果將更多精力投入了新硬件產(chǎn)品的研發(fā)——Vision Pro,而非AI硬件。
路線差異背后,意味著一旦踏錯,蘋果幾乎就完全要依賴產(chǎn)品能力進行追趕。但近年來,蘋果所引以為傲后發(fā)至上的產(chǎn)品能力卻頻頻失效。
盡管經(jīng)歷了漫長的7年研發(fā),Vision Pro最終上市,但距離庫克的最初設(shè)想相繼甚遠;而在造車這事上,今天蘋果也正式宣布放棄,退出新能源汽車的競爭。
毫無疑問,大模型時代的硬件會重復(fù)計算機的老路:就是從算力集中于超算等大型設(shè)備上到算力一步步轉(zhuǎn)移至屬于個人終端。只是“實用主義者“蘋果,最終會在這個故事里扮演怎樣的角色,仍然要打一個大大的問號。