在10月10日舉辦的vivo開發(fā)者大會上,AI成為了絕對的主角。
大會期間,vivo發(fā)布了全新AI戰(zhàn)略——「藍(lán)心智能」,以及全面升級的自研藍(lán)心大模型矩陣、OriginOS 5、藍(lán)河操作系統(tǒng)2,以及vivo在安全、人文、生態(tài)合作等方面的最新成果。
自ChatGPT引發(fā)的生成式AI風(fēng)潮興起之后,AI成為智能手機(jī)領(lǐng)域當(dāng)下最炙手可熱的概念。但在過去一年的時間里,由于行業(yè)技術(shù)尚未完全成熟、基礎(chǔ)設(shè)施不健全等原因,市面上的AI手機(jī)大多還只停留在單一功能點創(chuàng)新的階段,并沒有出現(xiàn)令用戶期待的顛覆式革新,AI手機(jī)的概念也在爆火后迎來沉寂。
行業(yè)沉寂之時,恰恰是參與者深度思考的好時機(jī)。手機(jī)廠商試圖解答圍繞端側(cè)AI的核心問題:它到底能夠做什么,以及應(yīng)該實現(xiàn)怎樣的目標(biāo)?
蟄伏11個月之后,vivo帶來了一張新答卷——將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合的藍(lán)心智能。它以藍(lán)心大模型為技術(shù)底座,能夠理解用戶的個人情景和偏好,通過更自然、更符合直覺的交互,來為用戶提供個人化的專屬服務(wù)。為此,vivo做了一系列系統(tǒng)重構(gòu)的工作,也重新定義了人與設(shè)備、人與數(shù)字世界、人與物理世界的交互與連接。
從單點創(chuàng)新,到系統(tǒng)重構(gòu)
提起AI手機(jī),大部分用戶可能會第一時間聯(lián)想到文生圖、路人消除、會議紀(jì)要等生成式AI相關(guān)功能。在ChatGPT 3.5時代,這些功能為用戶提供了眼前一亮的體驗,但絕不是對AI手機(jī)的全部定義。手機(jī)廠商意識到,大模型要真正在端側(cè)發(fā)揮功效,最難且最核心的挑戰(zhàn),一定在于對系統(tǒng)的重構(gòu)。
藍(lán)心智能就是一次突破性的嘗試。在OriginOS 5中,vivo對于AI手機(jī)的構(gòu)想有了更全面的落地。vivo副總裁、OS產(chǎn)品副總裁、vivo AI全球研究院院長周圍將vivo在過去11個月的努力總結(jié)成三件事:升級已有功能、構(gòu)建公共能力并向第三方開放,以及構(gòu)建具有執(zhí)行能力、真正服務(wù)于人的智能體。
第一件事是用AI來升級現(xiàn)有的手機(jī)功能。以搜索為例,這是用戶在手機(jī)上最常使用的功能之一。過去的搜索限定在特定APP的搜索框內(nèi),用戶需要復(fù)制關(guān)鍵文字,再切入特定APP內(nèi)進(jìn)行操作,這種做法顯然低效。
OriginOS 5內(nèi)置的小V圈搜功能,采用了一種更符合直覺的人機(jī)溝通方式:通過長按導(dǎo)航條的形式將它呼出,直接用手指圈選手機(jī)上的圖片、文件、文字等任意內(nèi)容并向下拖拽,即可完成一次搜索。這還不僅僅是一次簡單的搜索,也能夠融合用戶的個人數(shù)據(jù)來做下一步操作的意圖識別,用更本地化的思維做主動的理解和思考。
于是,人與設(shè)備的交互開始變得更自然。Origin OS 5搭載的「原子島」功能,將原有的通知功能結(jié)合了藍(lán)心小V的意圖識別能力,能夠不斷分析和判斷用戶當(dāng)前需求,主動提供后續(xù)服務(wù)。用戶可以通過一按一復(fù)制,或一按一拖拽的交互形式來布置任務(wù);新升級的「小V建議」以桌面常駐組件的形式,根據(jù)用戶所處的時間地點,不間斷地為用戶提供打車建議、登機(jī)口提醒、旅行城市攻略等。
改變了交互形式之后,vivo做的第二件事是重構(gòu)數(shù)字服務(wù)體驗,這不能只依靠vivo一家的力量。
過去用戶需要下載不同的APP來滿足不同的需求,但同時也帶來了內(nèi)存負(fù)擔(dān),且體驗不夠智能。vivo一邊搭建好基礎(chǔ)設(shè)施,一邊將自有的AI能力向第三方合作伙伴開放,讓用戶在需要作業(yè)指導(dǎo)時,可以用教育智能體來進(jìn)行在線輔導(dǎo),有就醫(yī)需求時,用醫(yī)療的智能體來幫助掛號。
第三件事也是最具挑戰(zhàn)性的一件事,即真正讓AI代替用戶來執(zhí)行部分操作。
OriginOS 5搭載了vivo自研的手機(jī)智能體「PhoneGPT」,這是一個可基于用戶意圖和習(xí)慣,實時自主拆解需求并主動規(guī)劃路徑的多模態(tài)助理。例如其中的「小V訂座助手」功能,通過語音對話說出想要預(yù)訂的餐廳類型、時間,和人數(shù)后,它可以自主跳轉(zhuǎn)相關(guān)APP,找到符合需求的餐廳,識別餐廳電話并自動進(jìn)行電話預(yù)約。
從理解訂餐意圖到完成電話預(yù)約,這是一個極其復(fù)雜的鏈路,它需要讓PhoneGPT盡可能接近于人,像人一樣會識別界面、會與餐廳交流。這是完全由vivo訓(xùn)練的大模型,在數(shù)十萬應(yīng)用投喂訓(xùn)練的之后,vivo把一個操作步驟的執(zhí)行時間速度縮短到了2秒,而這僅僅是一個起點。隨著PhoneGPT逐漸強(qiáng)大,相應(yīng)的功能也會變得更加豐富。
做符合直覺、遵循常識的事
OriginOS 5是vivo對 AI 手機(jī)階段性解答。事實上,AI手機(jī)到底應(yīng)該怎么做,所有手機(jī)廠商都在摸著石頭過河。
周圍在接受采訪時說道,做傳統(tǒng)智能手機(jī)時,vivo總是要進(jìn)行小半年的用戶和市場調(diào)研,收集有效反饋來成為下一代產(chǎn)品的參考。但在真正考慮做AI之前,vivo花五個月時間做了用戶和市場調(diào)研,卻無法從用戶身上得到任何有效的反饋。在全新的技術(shù)爆發(fā)面前,用戶對自己的需求也沒有任何感知。
這是拋給手機(jī)廠商的難題。在經(jīng)歷長達(dá)十年的智能手機(jī)高速增長時期之后,vivo們再度走回了「不舒適區(qū)」。
但vivo已經(jīng)考慮好了要走的路。作為最早投入人工智能研發(fā)的手機(jī)廠商之一,早在2017年,vivo就啟動了人工智能的研發(fā),此后陸續(xù)組建了AI全球研究院、人工智能圖譜研究院等機(jī)構(gòu)。迄今,已經(jīng)有數(shù)百人專注研發(fā)AI大模型,并且維持著千人以上的專業(yè)AI團(tuán)隊。
這為vivo帶來了更豐富的認(rèn)知和技術(shù)儲備。在ChatGPT問世之前,vivo就已在2019年的開發(fā)者大會上系統(tǒng)闡述過對手機(jī)AI的思考。當(dāng)時的vivo將下一代智能手機(jī)定義為“智慧手機(jī)”,自主人工智能品牌Jovi作為智慧手機(jī)的中樞系統(tǒng),將消費者希想要的服務(wù)精準(zhǔn)、按時、按需地送達(dá),這種思路也恰好是如今藍(lán)心智能的雛形。
在OriginOS 5中,“Jovi語音”與“藍(lán)心小V”進(jìn)行了深度的融合,升級后的藍(lán)心小V智慧能力全面升級,為用戶帶來便捷的溝通方式、默契的服務(wù)推薦、溫暖的共同記憶、貼身的時刻陪伴。
vivo一直以來都在強(qiáng)調(diào)的是,AI帶來的體驗應(yīng)該是更自然的。從OriginOS 5的升級也不難看出這一點。例如小V圈搜功能的升級,是把指甲蓋觸碰屏幕的方式,換成了用手指來圈選屏幕,這兩者看似區(qū)別不大,但本質(zhì)上是為了讓操作和交互更符合人的自然習(xí)慣和直覺。
vivo還是少有的在聲音大模型領(lǐng)域保持重投入的手機(jī)廠商。在其最新發(fā)布的聲音大模型中,手機(jī)已經(jīng)能夠?qū)崿F(xiàn)各種口音的自然交互,包括粵語、四川話、東北話、河南話,甚至還有苗語。并且,手機(jī)和用戶不再是干澀和機(jī)械的對話,而是帶有人的氣息的真實互動。
這是對手機(jī)語音交互的一次重塑,它讓語音互動真正成為了人人易于使用的功能,把使用AI的門檻進(jìn)一步放低,讓AI服務(wù)于人,而不是人來適應(yīng)AI。
就像iPhone打破諾基亞統(tǒng)治的市場那樣,每當(dāng)更符合自然和直覺的交互產(chǎn)生的時候,產(chǎn)品體驗一定會帶來巨大的變革。在周圍看來,這才是手機(jī)廠商做大模型真正的意義所在——如果只做大模型,而想不出怎么用大模型,也就沒有做大模型的必要。
“我很認(rèn)同一句話,如果沒有正確的認(rèn)知,黃金就不是黃金,而是土。”周圍說,對AI的重投入,為vivo帶來的不僅僅是技術(shù)創(chuàng)新能力的躍遷,更重要的是認(rèn)知的豐富與轉(zhuǎn)變。某種程度上,這也是當(dāng)下競逐AI手機(jī)戰(zhàn)場的廠商最稀缺的一種能力。
熱度當(dāng)前,回歸本原
許多人將2024視為AI手機(jī)元年。主流手機(jī)廠商紛紛開始將AI作為最大的新品賣點之一,甚至有廠商宣布放棄傳統(tǒng)智能手機(jī)研發(fā),把所有資源投入到AI領(lǐng)域。業(yè)界期待AI成為手機(jī)行業(yè)下一個突破式創(chuàng)新,迎來自己的ChatGPT時刻。
AI的確已經(jīng)必不可少,但無論技術(shù)如何前進(jìn),但消費者的本質(zhì)需求并沒有改變。多數(shù)用戶對復(fù)雜的大模型參數(shù)并不了解,也不關(guān)心AI技術(shù)的發(fā)展,他們的需求非常簡單直接:流暢、舒適、自然、高效。
這也正是vivo的目標(biāo)。周圍的觀點是,vivo的目的從來不是顛覆手機(jī)行業(yè)。事實上,現(xiàn)有的行業(yè)技術(shù)成熟度,也還很難談?wù)嬲念嵏?。這的確是行業(yè)現(xiàn)狀:自生成式AI火爆以來,它最被用戶高頻使用的功能,并不是新創(chuàng)造的場景,而是通過AI來賦能已有場景,讓工作、學(xué)習(xí)和生活變得更加高效、簡便。
AI手機(jī)同樣如此。對手機(jī)廠商來說,目前更現(xiàn)實且有效的做法是,結(jié)合自身在AI領(lǐng)域的技術(shù)積累,利用手機(jī)廠商的端側(cè)優(yōu)勢,對現(xiàn)有的能力進(jìn)行不斷優(yōu)化、升級,做好連接,做更符合用戶直覺和常識的事情,就是一種巨大的進(jìn)步。例如,過去手機(jī)只能傻瓜式地遵循用戶指令,現(xiàn)在已經(jīng)可以主動感知場景、幫助用戶做決策甚至執(zhí)行操作。
避開鋒芒與噱頭,冷靜、積極地面對技術(shù)浪潮的到來,這是vivo在AI時代的選擇。這種選擇離不開vivo的「本分」文化。本分文化強(qiáng)調(diào)保持平常心,即在面對困難、壓力和誘惑時,能夠拋開事物表面的干擾,回歸事物的本原進(jìn)行思考,堅持做正確的事,并力求把事情做正確。
什么是正確的事?vivo始終堅持的一條原則是堅持用戶導(dǎo)向式創(chuàng)新。無論是重金投入的影像、自研芯片的創(chuàng)造性嘗試,還是AI重構(gòu)系統(tǒng)的決心,vivo的一切工作都圍繞用戶需求來開展,通過極致場景價值檢驗、耦合式創(chuàng)新點投入和底層技術(shù)創(chuàng)新支撐,逐步實現(xiàn)用戶體驗的躍級。
市場選擇是最直觀的。據(jù)Counterpoint、Canalys以及BCI三大行業(yè)分析機(jī)構(gòu)發(fā)布的2023年度智能手機(jī)市場數(shù)據(jù),vivo均位居全品牌第二、國產(chǎn)品牌第一。2024前三季度,vivo仍然位列國內(nèi)市場首位,在vivo X100系列、vivo X Fold3等的帶動下,vivo在高端市場的占比也有了明顯提升。
在此起彼伏的科技公司AI大戰(zhàn)中,vivo仍然是那個悶聲做實事的角色。vivo的目標(biāo)并不遠(yuǎn)大,但足夠?qū)嶋H:“我們從來無意定義AI手機(jī),但是我們希望用戶用完能說,這個手機(jī)很AI?!?/p>