文|光子星球 王 潘 吳坤諺
編輯|吳先之
生成式AI走向大眾市場的關鍵時期已經(jīng)到來。
2月16日,OpenAI推出了堪稱“王炸”的文生視頻大模型Sora,AI軍備競賽的戰(zhàn)場加速向多模態(tài)轉(zhuǎn)移,這意味著相比尋常LLM更為豐富的場景與機會。此外,2024年將成為AI硬件元年的共識也基本形成,業(yè)界對AI在智能終端的應用寄予厚望,將其視為提振消費電子市場的關鍵。
智能手機與PC兩大終端的戰(zhàn)況愈發(fā)激烈,而玩家們眼中的終局似乎與通用模型基座并無二致——廠商忙不迭搞起大模型與OS,互不兼容的同時卻又在功能上高度趨同,將行業(yè)引向近在咫尺的紅海。
與之相比,未被大公司注意到的細分場景反而成為創(chuàng)業(yè)者的樂土。當AI與硬件實現(xiàn)耦合的場景愈發(fā)豐富,AI終于開始擺脫生產(chǎn)力工具的固有印象,其技術落地的場景愈發(fā)貼近消費語境。如曾在去年為業(yè)內(nèi)熱議的Humane的AI Pin和Rabbit的R1,均試圖跳脫出既往智能終端的束縛,從而更貼近我們的生活。
正因如此,此時我們更應該關注這些未被商業(yè)競爭所桎梏的創(chuàng)新,興許能為國內(nèi)大模型的商業(yè)落地提供更多視角。
我們注意到,繼AI Pin和R1之后,來自新加坡的AR初創(chuàng)公司Brilliant Labs剛剛推出一款嵌入多模態(tài)AI功能的AR智能眼鏡“Frame”,再次試圖將AI從我們熟知的智能終端中解放出來。
Frame看起來是一副平平無奇的框架眼鏡,鏡架中央搭載了微型攝像頭,以及右鏡頭嵌入一個640 x 400像素的微型OLED顯示屏。AI大模型的能力主要依賴于云端和無線接入,由Brilliant Labs推出的AI Agent “Noa”統(tǒng)籌,能夠進行現(xiàn)實世界的視覺處理、創(chuàng)新圖像生成以及實時語音識別和翻譯。
從工程體驗看來,F(xiàn)rame有些類似于是谷歌眼鏡與Ai Pin的結合。
在Brilliant Labs看來,AIGC為我們打開了新的數(shù)字世界大門,這個嶄新的世界需要更加自然地融入人們所見和體驗的物理世界,而Frame應運而生。
AI硬件,手機的延伸
在智能手機的絕對優(yōu)勢面前,智能硬件一直像是一只長期盤旋在周圍的老鷹,時刻準備著啄出一個缺口?,F(xiàn)在它們距離成功已經(jīng)很近了。
回顧AIGC浪潮前的智能硬件,不難發(fā)現(xiàn)它們并沒有不可替代性,甚至難言創(chuàng)造了新的使用場景。就像10余年前的智能眼鏡、8年前的智能音箱、3年前的XR頭盔,它們都曾經(jīng)歷過短暫的高光時刻,燃燒自己為市場一點點建立消費認知。
說白了,自智能手機問世起至今,集成了越來越多功能的手機也在變得越來越難以替代,試圖創(chuàng)造下一個手機來徹底取代這個消費品的嘗試大多都失敗了。因而,我們也在AI硬件創(chuàng)業(yè)中清晰地看到路線轉(zhuǎn)換——硬件不再試圖取代手機,而是成為手機的延伸。
交互方式的革新是生成式AI為硬件帶來的全新變量。以Frame為例,作為市場上首款多模態(tài)AI眼鏡,Frame提供一個無需屏幕即可獲取AI能力的交互方式,交互圖形界面會呈現(xiàn)在右鏡片的OLED顯示屏中,我們可以使用語音、點觸以及眼球轉(zhuǎn)動與之交互。
如此一來,新的AI硬件與此前的手機便不會構成“換機”式的替代關系,甚至用戶會為了縮短獲取AI能力的鏈路,從而購買硬件來配合手機使用。這是新一代AI硬件之所以在商業(yè)模式上能成立的根本邏輯。
我們了解到,在這款產(chǎn)品在設計之初,Brilliant Labs便為其立下了重構個人數(shù)字生活的目標,尤其是重構我們?nèi)祟惻c周身無數(shù)電子設備的關系。
另一方面,智能手機這個鐵桶陣被啄出缺口的原因還在于智能手機作為終端載體的成熟程度,載體的成熟意味著更高的落地要求。典型表現(xiàn)便是這樣的集成智能終端剛需運行端側大模型的能力,否則便與通過App獲取云端模型能力的“前輩”們找不出區(qū)別,也就難以驅(qū)動新的換機周期。
目前,端側大模型能力展現(xiàn)必備的NPU還處于集中研發(fā)期,可靠的產(chǎn)品方案出現(xiàn)之前,這無異于為其他AI硬件提供了一個突破口。
Brilliant Labs選擇將自己積累的光學與AR技術為突破的尖刀,Brilliant Labs創(chuàng)始人、CEO Bobak Tavangar在既往AR眼鏡的基礎上引入了一款類似于《鋼鐵俠》中JARVIS的AI助手“Noa”。更重要的是,Brilliant Labs還為Frame打造了一個可以同時運行多個大模型的CPU。
在全天候AI助手Noa的統(tǒng)籌下,F(xiàn)rame可以調(diào)用不同云端模型能力處理不同任務,甚至同時組織多個AI系統(tǒng)一起完成更高級的任務,比如我們對著一本全英文的菜單,讓Noa為我們推薦一個口味合適的搭配。
更值一提的是,智能手機廠商匆匆踏入AI大模型賽道時,他們眼中的商業(yè)化終局是打造出下一時代的集成式硬件入口,即一個AI OS。這導向了當下大模型能力和硬件互斥的情況,將競爭拉向模型底層。
Frame選擇以開源方式接入GPT等在內(nèi)的模型能力,“讓上帝的歸上帝,讓凱撒的歸凱撒”,無需陷入模型層的競爭泥潭。Bobak稱,“我們創(chuàng)業(yè)的最初靈感便來自于豐富的開源生態(tài),唯有開源才能讓一個產(chǎn)品接受全人類、全世界的體驗和檢視,更多創(chuàng)造性的火花也迸發(fā)于此?!?/p>
比手機更深入生活
回看Frame的產(chǎn)品形態(tài),與我們熟悉的虛擬現(xiàn)實設備動輒重達上百克不同的是,其在搭載了電池以及上述元器件的情況下,重量僅40克(1.4盎司)。如此輕巧、便攜、簡約的設計隱約透露出一股“蘋果味兒”。
果不其然,Bobak本就出自蘋果。我們了解到,在他任職于蘋果期間,他曾負責多個硬件項目的設計工作。
Bobak從蘋果身上學到的最重要的設計理念是“以人為中心”,追求貼合用戶的實際使用語境,而工程、銷售、供應鏈等環(huán)節(jié)都只能“適配”于這個中心理念。“好的設計精準匹配某些群體或場景,偉大的設計從開始便向往匹配所有人”, Bobak的觀點與其產(chǎn)品一般,強調(diào)普適性。
我們不妨審視蘋果推出的新品,無論是無線耳機AirMax亦或是Vision Pro,看著都不太像喬布斯設計出的東西。同一家公司因為掌舵者的變化使得產(chǎn)品追求不能一以貫之,可見產(chǎn)品理念在多方因素下的脆弱與可貴。
或因如此,F(xiàn)rame天然是一個極其貼近消費語境的產(chǎn)品。除設計語言外,它對消費場景的貼合還在于其取代了手機屏幕的AR顯示屏,讓我們使用AI能力時不需要掏出手機打開App,極大簡化了流程,縮短了鏈路。
馬斯克與英偉達AI科學家Jim Fan所提出的“具身智能”或者說“環(huán)境智能”,便是讓AI的物理存在感降低,只在我們需要的時候出現(xiàn)。
對于面向大眾消費群體的硬件而言,其使用場景必然極其生活化。人們追求使用上的“無感體驗”,要求沉浸感以及更多的交互能在無意識下發(fā)生。如今,手機這個集成最多日常功能的智能終端,儼然成為我們獲取某項服務的一種儀式道具,就像上世紀的互聯(lián)網(wǎng)需要調(diào)制解調(diào)器與電話線。
為了進一步加強AI賦予硬件的交互革新,Brilliant Labs與時下領跑AI搜索賽道的 Perplexity展開深度合作,顯著提升了AIGC內(nèi)容的可溯源度。
Perplexity由出身于OpenAI的Aravind Srinivas于2022年8月創(chuàng)立,目前估值5億美元。其問答引擎可以說是對傳統(tǒng)搜索引擎的一次升級,在理解用戶提問的基礎上將問題解析為更精細化的數(shù)個搜索指令,最終由模型閱讀并篩選出內(nèi)容以輸出結果。
當我們向Perplexity提問,最終呈現(xiàn)的結果是一個不亞于百科的全面回答,不同信息的出處均可溯源,甚至側邊欄會呈現(xiàn)與主題相關的圖片與視頻。簡單來說,Perplexity所做的是讓搜索引擎“更懂你”,這是對搜索顆粒度的進一步細化。
另一方面,Perplexity也為生成式AI增添了一份時效性與準確性,這直指模型能力最為人所詬病的“幻覺”。當這一功能被添加進Noa的多模態(tài)功能組后,我們可以隨時隨地、解放雙手地獲取來自網(wǎng)絡的實時可靠信息。
在Perplexity的能力調(diào)用下,F(xiàn)rame可以通過簡單的交互動作,在Noa的訪問下了解、認知并觸達我們身邊的萬事萬物。比如我們看向自己家的房子,便可以在貝殼App上搜索其房源;轉(zhuǎn)頭看看久不打理的雜物房,便可以獲取一套包含用品、方法在內(nèi)的清潔方案。
Bobak表示,“我們希望Frame能夠使人們以全新的方式彼此連接,并在日常生活、工作場所、課堂等方面開啟新的體驗,真正為人類與數(shù)字世界以及彼此之間的接口帶來了新的范式”。
走向星辰大海的不同航路
生成式AI代表未來是東西方大模型創(chuàng)業(yè)者的共識,而就AI發(fā)展道路來看,這個共識之后延伸出的道路卻在不同的構想中走向分野,就像字母Y一般。
在中國創(chuàng)業(yè)語境里,“入口”往往是某個產(chǎn)品或業(yè)務的終局。在既往發(fā)展路徑與移動互聯(lián)網(wǎng)高速發(fā)展的引導下,我們追求的是極致規(guī)?;瘞淼慕跤趬艛嗟氖袌龅匚?。
海外則與之不同,產(chǎn)品或業(yè)務的終局是通過極致工程化來盡可能放大產(chǎn)品對人類社會發(fā)展進程的影響,做那只大洋彼岸煽動翅膀的蝴蝶。當影響力足夠大時,商業(yè)模式與盈利也將隨之而來。
或許這也是為什么面對同樣的AI硬件風口,國內(nèi)企業(yè)會一窩蜂擠進確定性較強的AI OS賽道,而以Brilliant Labs為代表的海外創(chuàng)業(yè)者會從不同的角度切入較垂直的細分場景,尋找潛在的機會。
正如法國哲學家在批判現(xiàn)代工業(yè)社會時提出的“單向度的人”,效率至上的社會節(jié)奏規(guī)訓出人們單一的價值取向和判斷標準,一維的社會聲音和思想逐漸形成, Bobak希望能通過他的產(chǎn)品改變這一現(xiàn)狀。
“我一直鼓勵人們學習從多個層次(Layers)去看待周圍的萬事萬物,跳脫出經(jīng)歷、觀念、教育等帶來的局限性。而Frame便是用來幫助我們從多層次、多維度與多角度觀察世界的工具?!?/p>
正是這一愿景推動Brilliant Labs將AI與AR技術相結合,并推出了Frame。這背后的邏輯是,如果大模型本身解決了最基礎的交流,那么虛擬現(xiàn)實與多模態(tài)便賦予了AI更豐富的交互與感知,這本身便是一個創(chuàng)新機遇所在。
反過來看,AR這項技術也不應自我限制在簡單的娛樂上。
Brilliant Labs創(chuàng)立時恰逢疫情與NLP、CV一類AI技術大爆發(fā)期間,但AR賽道的創(chuàng)業(yè)者們在以Pokemon GO為代表的數(shù)個成功案例的引導下,不斷將AR概念向影音、游戲等娛樂方式推動。彼時的Bobak便時常捫心自問,這究竟是不是AR的終局?
這樣的疑問在AI之下得到了解答,Bobak早在大模型風起前數(shù)年便將目光投向AI,并構想了一個透過AI突破人類承載知識的極限,從而成為尼采設想中的“超人”的終局——all of the knowledge on the internet will live within our minds(互聯(lián)網(wǎng)上的所有知識都將存在于我們的腦海中)。
“Noa不僅是一個多模態(tài)AI助手,它的知識圖譜還可以持續(xù)記錄、分析使用者遇到的問題并總結經(jīng)驗”,Bobak說,“如果我們使用Frame足夠長的時間,這些個性化的知識與經(jīng)驗便可以傳承給我們的后代”。
如果說上文提到的Perplexity解決了我們獲得去偽存真的互聯(lián)網(wǎng)信息的問題,那么Noa的知識圖譜解決的便是個性化的私人經(jīng)驗問題。作為一款支持處方鏡片的AI眼鏡,F(xiàn)rame天然有著比智能手機更長的使用時間,也能通過與我們的交互,感知并記錄更多生活上的細節(jié),無論是學習、求職、婚戀還是養(yǎng)老。
那么當我們的后代使用Frame,與我們的personal Noa交互,其便能在他們遇到相似情況時給出建議,比如求職時應如何應對面試官,學習時要通過思維導圖提升效率等,讓人們都不會再“淌入同一條河流”,就像美劇《權力的游戲》中能看見古今未來的三眼烏鴉。
當然,長期主義下的終局仍需持續(xù)的商業(yè)運作,F(xiàn)rame作為一個面向普羅大眾的硬件產(chǎn)品,它還是要考慮其受眾、盈利、商業(yè)模型等問題。
據(jù)悉,F(xiàn)rame在銷售上采取了以直銷為主的銷售模式,其已于日前開啟預定,并在2024年4月開始發(fā)貨。如果Frame進入大陸地區(qū),其還將支持調(diào)用包括文心一言在內(nèi)的國產(chǎn)大模型。我們還了解到,目前預定Frame最多的群體并非對AI感興趣的普通人,而是根植于賽道內(nèi)的開發(fā)者。
和許多帶有極客色彩的創(chuàng)新產(chǎn)品相似,面對一個全新的產(chǎn)品,往往是開發(fā)者率先嘗試并形成由美國學者埃弗雷特·羅杰斯提出的創(chuàng)新擴散模型。實際上,無論是開發(fā)者還是早期用戶,在面對一個不甚成熟的產(chǎn)品時都會自發(fā)探索其邊界,最終通過社區(qū)、社交媒體、私域等渠道與企業(yè)建立良好的強化反饋體系,幫助產(chǎn)品迭代。
整個2023年,AI技術在頂層設計與B端商業(yè)化的影響下,直至去年9月才開始大規(guī)模面向用戶,這導致AI的創(chuàng)新擴散走了大半年的限速車道。這也是國內(nèi)大模型應用落地遜于海外的原因之一。
AI硬件賽道持續(xù)火熱,在這條試圖通往AGI的航路上,我們目前難以斷言東西方的不同創(chuàng)業(yè)者中,誰將率先拿下賽點。或許,商業(yè)化的終局導致AI PC與AI Phone的發(fā)展已經(jīng)開始進入相互角力的垃圾時間,而小而美的創(chuàng)業(yè)公司更能代表生成式AI的創(chuàng)新與未來。