文|光子星球 吳坤諺
編輯|吳先之
急需找到新飛輪的手機廠商,盯上了大模型。
華為在8月初的開發(fā)者大會上宣布將在 HarmonyOS 4中搭載的AI助手小藝接入大模型,并在8月底邀測;小米也差不多同一時間開啟了其AI助手小愛接入大模型的邀測。OPPO與vivo緊隨其后,兩者均在11月開始手機大模型的落地嘗試。
“將大模型塞進手機”于業(yè)界并不是新鮮事兒,不談自10月中旬開始密集預熱的vivo,榮米O三家均曾在今年召開的發(fā)布會上透出過相關消息。業(yè)界普遍看法是智能手機賽道的硬件部分幾乎卷無可卷,而大多跑在云端的大模型恰是一個游離于硬件之外的變量。
需要注意的是,端側(cè)部署對大模型賽道而言同樣也是行業(yè)趨勢。以ChatGPT為例,作為云側(cè)大模型的典型代表,其訓練與推理都跑在微軟的Azure上,用戶則通過瀏覽器或App獲取結(jié)果。input-output來回之間,不僅存在影響使用體驗的時延,耗能、算力等云端成本也居高不下。
從實際場景與需求來看,不少需求完全可以通過邊緣設備來滿足,尤其是手機、PC、新能源車等廣泛應用的終端。
于是,大模型的端側(cè)部署逐漸成為共識,不僅有手機廠商鉚足了勁訓練模型,PC賽道聯(lián)想與芯片賽道的高通等均在前段時間發(fā)布了端側(cè)AI的相關解決方案。尤其是剛剛發(fā)布的高通驍龍8 Gen3以及聯(lián)發(fā)科天璣9300,其AI性能的提升可以說是手機端大模型的基礎。
行業(yè)需求與硬件條件都已被滿足,大模型終于可以進入手機之內(nèi)??闪钊祟H為意外的是,率先掏出“完整產(chǎn)品”的手機廠商竟是vivo。
vivo大模型成色如何?
11月1日,vivo召開開發(fā)者大會,于會上發(fā)布了自研大模型矩陣"藍心"(BlueLM),包含十億、百億、千億等不同參數(shù)規(guī)模。同時還發(fā)布了適配其大模型的自研操作系統(tǒng)OriginOS 4。
面對大模型這塊“應許之地”,vivo的急切幾乎寫在臉上。
據(jù)10月26日市場調(diào)研機構Canalys公布的最新數(shù)據(jù),vivo出貨量出貨量下滑,排名也出現(xiàn)下跌。vivo迫切需要大模型以及OriginOS 4來扭轉(zhuǎn)局勢,率先下場“開卷”并不讓人意外。
而且與大模型相比,本次vivo推出的OriginOS 4的更新跨度略顯寡淡。在公域討論中,不僅其虛擬顯卡、異構計算空間與輕量化等迭代幅度不及預期,vivo用戶中聲量頗高的原子通知等模塊也沒有升級。也就是說,大模型才是本次發(fā)布會的主角。
從業(yè)務模式看,vivo本次發(fā)布會展示的路線與此前業(yè)內(nèi)其他玩家相似,以人工智能助手為載體,采取端側(cè)+云側(cè)混合的部署方式,其中作為重頭戲的端側(cè)大模型,呈現(xiàn)本地化、輕量化的明顯特征。
這么做的目的顯而易見,手機這一方小天地所提供的功耗、算力與機房不可同日而語。只是如何將模型能力與手機深度結(jié)合成為手機廠商們迫切需要突破的“konw how”。
對此,vivo給出的解決方案是推出多參數(shù)規(guī)格模型,其中主要面向文本場景的10億規(guī)格與面向自然對話、知識問答長焦的70億規(guī)格為端側(cè)部署的重頭戲。在官方介紹中,10億規(guī)格單獨面向端側(cè),70億規(guī)格設為端云兩用,自700億起均為云端部署,這也體現(xiàn)了vivo在端云協(xié)同上“讓上帝的歸上帝,讓凱撒的歸凱撒”的矩陣思路。
這與谷歌在今年5月的 I/O 開發(fā)者大會如出一轍,當時谷歌發(fā)布的大模型 PaLM2 有四個參數(shù)規(guī)格,其中小參數(shù)模型可在離線狀態(tài)下實現(xiàn)每秒處理20 tokens,適配于終端的離線使用。
如果就此認為vivo是“拾人牙慧”則未免過于嚴苛。實際上,vivo早在2017年便著手組建內(nèi)部人工智能團隊,時至今日,vivo人工智能研究院已有過千研究人員。
縱使其技術沉淀總體上不如阿里、百度等第一梯隊,但開源社區(qū)的存在也讓稍晚入場的玩家們能迅速趕上大部隊。而vivo在2018年成立的知識圖譜研究院也能在一定程度上補強其作為手機廠商可能遭遇的訓練數(shù)據(jù)不足問題。
至于模型能力方面,vivo在預熱時期便交出了一份不錯的答卷。據(jù)悉,BlueLM在中文大模型第三方測評集C-Eval中獲得了“受限訪問模型”類目的第一名。其官方通告中稱BlueLM是行業(yè)內(nèi)首家7B端側(cè)大模型。
但是在測評中斬獲高分卻實際表現(xiàn)不如人意的模型不在少數(shù),更是有業(yè)內(nèi)人士稱這份榜單已經(jīng)在過去一段時間被“刷脫皮”了,只能代表模型“做題”的能力而無法體現(xiàn)推理、安全、應變等能力。照此來看,vivo的業(yè)務成果顯然還需要更多實際檢驗。
況且,vivo目前展示的云端模型能力如文生圖、交互等并未跳出大模型賽道窠臼,新意有限。而且其作為重頭戲的端側(cè)模型能力還停留在測試階段,同時端側(cè)能力的展現(xiàn)也必然受到手機硬件的限制。
我們了解到,多位受邀參與藍心內(nèi)測的用戶使用的是以X90 Pro為代表的旗艦機,這批機型也是目前vivo釋出的大模型應用公測適配時間表中最為靠前的。
毫無疑問,大模型正在成為手機廠商開辟高端化的第二戰(zhàn)場,同時也是盤活用戶,激活IoT的重要變量。盡管如此,vivo依靠大模型增加高端產(chǎn)品價值的打算,還存在諸多變量
歸根結(jié)底,大模型的推出既是vivo高端化的新基石,也是其試圖拉動新機與高端產(chǎn)品的一駕馬車。
低端機型自然難以勝任這場高端化的戰(zhàn)爭。以vivo于本次發(fā)布會前發(fā)布的基礎機型Y100為例,這是上述適配計劃中最晚上線的機型之一,如此類似“背刺”的舉動背后是vivo希望靠高端產(chǎn)品重回王座的“小算盤”。
縱使如此,大模型的推出還是不太能成為vivo高端產(chǎn)品的加分項。
開源社區(qū)端側(cè)大模型創(chuàng)業(yè)者王陽(化名)告訴光子星球,大模型在端側(cè)的能力表現(xiàn)在于其NPU(專門為深度神經(jīng)網(wǎng)絡計算而設計的處理器)所帶來的AI性能。而在vivo既往機型中,并不注重NPU能力,因此老機型大概率難以順暢地跑大模型。
至于即將發(fā)布的,搭載聯(lián)發(fā)科天璣9300旗艦芯片與新一代AI處理器的新機型vivo X100系列或許能順暢使用模型能力,但在在市面上早已存在文心一言、訊飛星火等大模型應用的情況下,留給手機端的空間沒有想象中那么大。相比于能力,或許vivo這次展示的玩法更值得深究。
讓手機再智能一些?
力推微軟成為 OpenAI 天使投資人的微軟CTO Kevin Scott 曾公開表示,模型本身不是產(chǎn)品,而是基礎設施。言下之意是在訓練精調(diào)出模型底座后,產(chǎn)品化的探索才是一眾玩家們“二次創(chuàng)業(yè)”的核心。
大模型于手機端的“再產(chǎn)品化”水到渠成,但部署于手機端的大模型,還需要進一步產(chǎn)品化探索。從目前曝光的信息看,vivo將通過一款名為小V助手的應用來實現(xiàn)大模型能力,而目前業(yè)內(nèi)主流路線也是將大模型能力嵌入既有的人工智能助手之上。
智能手機使用者存在對大模型理解能力的現(xiàn)實需求,無論是被戲稱為“人工智障”的智能助手還是在容量爆炸下日益臃腫的應用與數(shù)據(jù),都需要手機能更懂交互,幫助用戶梳理信息。而大模型的加入,本質(zhì)上便是為手機帶來自然語言理解能力。
未落地實裝的情況下,端側(cè)模型可能出現(xiàn)的功耗、散熱、時延等用戶體驗問題可以暫且不談。在王陽看來,vivo模型落地面臨的首要問題是多款模型配合使用時,如何區(qū)分不同模型的能力邊界以及如何調(diào)用,“這關乎最終的產(chǎn)品形態(tài)以及呈現(xiàn)”。
面對場景泛化且需求復雜的C端,不同需求調(diào)用的模型各不相同。例如端側(cè)的10億規(guī)格模型與70億規(guī)格模型需要針對用戶本地數(shù)據(jù)學習,試圖“更懂用戶”。那么能否通過模型能力以及與之適配的OS,在手機上實現(xiàn)復雜指令是重要指標。
目前來看,BlueLM展示的復雜指令功能頗具亮點。在新發(fā)布的OriginOS 4之下,小V助手常駐側(cè)邊欄的右下角,點擊即可彈出。不僅操作邏輯相對云側(cè)模型更短,更適配手機使用,同時也可以理解OS內(nèi)的一些復雜指令,例如智能搜索相冊、初步完成第三方App指令以及OS內(nèi)設置等。
值得一提的是,小V助手在功能與路徑上,和vivo既有的Jovi語音存在隔離,兩者相互獨立,這是明顯有別于此前其他廠商提出的端側(cè)大模型路徑。
從功能上看,小V助手基本可以做到Jovi語音的全覆蓋,那么兩者區(qū)分的目的很可能是為了便于用戶感受兩者之間的差別。而且小V助手的產(chǎn)品邏輯形態(tài)與微軟全家桶中搭載的Copilot相似,兩種不同的路徑很可能會在未來完成整合。
這也體現(xiàn)出目前的BlueLM還處于試水階段,產(chǎn)品形態(tài)難言成熟。
據(jù)參與BlueLM內(nèi)測人士反饋,以vivo旗艦機型使用模型能力,輸入20 tokens以內(nèi)的純文本生成需求還存在2s~5s的時延,這對于后續(xù)實裝而言不算是個好消息——云側(cè)模型的時延并未得到很好的解決。這一點或許會在搭載芯片廠商最新AI芯片的機型中得到改善,只是對于消費者來說,這并不構成換機的理由。
此外,作為行業(yè)內(nèi)首個手機大模型,vivo的云側(cè)模型能力還面臨許多云廠商大模型的“圍剿”。
例如vivo宣布將上線應用商店的對話機器人藍心千詢,1750億的參數(shù)規(guī)格與當下應用商店中的大模型相比并不顯眼。云廠商中的百度已經(jīng)就近日發(fā)布的文心4.0專業(yè)版試水收費,而藍心千詢看起來更多只是vivo大模型生態(tài)中不算亮眼的一員,其道路顯然有阻且長。
不得不提的還有vivo作為后來者,技術沉淀的差距也將限制其大模型業(yè)務的進一步推進。
軟件方面,vivo大模型已經(jīng)成為阿里云旗下Pai機器學習平臺的宣傳素材,我們甚至可以從“藍心千詢”的命名中找到“通義千問”的影子。跑在云上的業(yè)務意味著長期成本,這一點在OpenAI上體現(xiàn)得淋漓盡致。成本視角下,如果vivo希望將BlueLM發(fā)展成為長期生態(tài),自建IDC顯然比上云更利于長期發(fā)展。
硬件方面,華為與蘋果兩家頭部廠商早已在現(xiàn)有產(chǎn)品線中集成自研的NPU能力,vivo則還需依賴于芯片廠商。即使模型訓練與調(diào)優(yōu)方面可以構筑一定壁壘,但作為核心的硬件差距仍導致其與頭部廠商拉開了數(shù)個身位。
大模型的終端戰(zhàn)事
大模型的加入,讓我們重新認識到智能手機的本質(zhì)是一種集成多種能力的智能終端,且同時身兼硬件與OS兩大入口。得天獨厚的條件使得手機天然需要與大模型相結(jié)合。
那么其他終端是否也可以接入大模型,就像重做應用一樣重新定義終端的能力邊界?
對于這一問題的探尋可以追溯到深度學習網(wǎng)絡爆發(fā)之時,而對端側(cè)模型可能性探討也源于業(yè)內(nèi)人“老生常談”的時延、能耗、隱私等問題,大模型的爆發(fā)成功地讓手機成為裝舊酒的“新瓶”。
實際上,早在本次往手機里塞大模型的熱潮正式開啟前,新能源車攜自動駕駛早已成為大模型的一個終端。業(yè)內(nèi)也不乏智能可穿戴設備搭載大模型的暢想,只是手機似乎即將憑借場景多樣性與網(wǎng)絡便利而后發(fā)先至。
更進一步說,當手機廠商密集發(fā)布大模型并投入使用后,屆時便是端側(cè)模型的一個絕佳的練兵場。我們也可以自手機大模型的落地情況,探討多種終端搭載大模型的方法論。
畢竟,無論手機上的模型如何出色,短時間內(nèi)能做到的最佳表現(xiàn)無非是一位用戶生活領域的“秘書”。其他智能終端搭載大模型所帶來的想象力無疑更大。
例如目前因移動支付而逐漸退出歷史舞臺的ATM,能否憑借大模型,讓用戶無需前往銀行排隊辦理深度業(yè)務;亦或是同屬B端場景的智能攝像頭,在醫(yī)療領域識別患者基本體征、在工業(yè)領域快速質(zhì)檢、在農(nóng)業(yè)領域智能灌溉等。而今憑借云側(cè)模型未能廣泛打開的B端市場,也可能將迎來端側(cè)這一變量。
這也是為什么vivo會在其生態(tài)尚不及華為、小米完善之時,便在本次發(fā)布會上展示了搭載在新款vivo Watch的藍河操作系統(tǒng)(BlueOS)。作為vivo面向通用人工智能時代研發(fā)的跨端系統(tǒng),其推出旨在通過手機帶動一系列IoT產(chǎn)品,無疑具備不錯的想象空間。
vivo亦宣布開源其7B規(guī)格模型,并推出了藍心大模型開發(fā)套件BlueKit,生態(tài)建設的野心昭然欲揭?;蛟S目前vivo只走到了讓IoT聽得懂指令的階段,但這對于vivo其后的高端化、生態(tài)化等戰(zhàn)略相當重要。
手機大模型的能力未知,面臨的挑戰(zhàn)很多,正式發(fā)布與落地之后,勢必為業(yè)內(nèi)帶來更多“開卷”的方向。更多千奇百怪的落地姿勢,正在等待業(yè)界的解鎖。