文|Metaverse元宇宙 孫浩南
大家都知道剛剛過去的2023年中AI被評為年度熱詞,其中OpenAI功不可沒,其推出的Chat-GPT一炮而紅,微軟的Copilot、谷歌的Bard、文心一言、通義千問等其他AI產(chǎn)品緊隨其后,各家企業(yè)共同創(chuàng)造出了AI的第一波浪潮。
今年剛開年,蘋果Vision Pro的發(fā)售為XR領域帶來了“空間計算”的概念。蘋果的熱度還未消退,OpenAI推出的Sora就帶來了AI的第二波浪潮,而在這波濤滾滾的AI浪潮中,我們似乎看到了蘋果與OpenAI“聯(lián)動”的未來雛形。
Sora掀起了AI的第二波浪潮
OpenAI在2023年推出了Chat-GPT,自此掀起了第一波AI熱潮,眾多大廠也攜帶著自家AI產(chǎn)品紛至沓來。你方唱罷我登場的現(xiàn)象讓大模型加持的AI浪潮徹底成勢,而現(xiàn)在,OpenAI的Sora又成功掀起了AI的第二波浪潮。
Sora取自日語單詞,意為“天空”,引申含義還有“自由”。在Sora官網(wǎng)頁面,無數(shù)只紙飛機在自由飛翔,行動自主,最后匯集成一片天空的背景色。
Sora的核心技術在于其先進的文本到視頻轉(zhuǎn)換算法與對現(xiàn)實物理世界的高理解度。使其能夠精準理解輸入的文本描述,并自動生成與之匹配的高質(zhì)量視頻。Sora讓“一句話(prompt)生成視頻”成為可能。這種能力的震撼之處在于, Sora在模擬物理世界時,能夠更準確地反映出現(xiàn)實世界的復雜性和多樣性。在OpenAI發(fā)布的宣傳視頻中,Sora展現(xiàn)出了出色的圖像生成能力和流暢的視頻編輯技巧,無論是細節(jié)刻畫還是整體風格把握,都展現(xiàn)出了極高的水準。
其實此前并非沒有類似的文生視頻AI工具,曾經(jīng)以“富二代、美女、高材生、創(chuàng)始人”多種網(wǎng)紅標簽而爆火的Pika Labs也讓AI界震驚了一把。但不論是它還是Runway、Pika、SVD(Stable Video Diffusion)、谷歌和 Meta等眾多同類產(chǎn)品,都只是小范圍的“驚艷”,直到OpenAI下場才成功掀起AI的第二波熱潮。
這場AI的浪潮滾滾而來,途中竟然與蘋果Vision Pro來了一次跨界“聯(lián)動”。
AI浪潮助推Vision Pro生態(tài)
蘋果Vision pro發(fā)售后,一躍成為迄今最先進的虛擬現(xiàn)實和增強現(xiàn)實眼鏡,蘋果公司將其稱為“空間計算設備”。OpenAI的創(chuàng)始人兼CEO山姆·奧特曼評價:蘋果Vision pro是自iPhone以后第二驚艷的技術。
Vision pro出現(xiàn)讓空間計算這個詞得到現(xiàn)實中完美呈現(xiàn),簡單說將我們周圍的現(xiàn)實物理世界和虛擬世界無縫整合,實現(xiàn)毫無違和感的沉浸式互動體驗。其中的空間視頻功能更是讓眾人深感震撼,在“蝴蝶落在指尖”的演示中Vision Pro能夠準確地為每個人確定他們的手指所在的位置,并使蝴蝶準確地落在他們的指尖上。一個評測者形容:“你甚至可以清晰地看到指尖上蝴蝶的觸手和絨毛,這讓我感覺有點起雞皮疙瘩”。
每一個空間視頻都帶給人們一種獨特的沉浸感,但可惜的是虛擬世界的搭建上和3D電影 沉浸式影片照片體驗,現(xiàn)階段都是基于VisionPro頭顯專用流媒體資源(至今為止可以訪問僅150 深度的3D娛樂項目),且需要依賴于強大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源, 哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶自主去捕捉拍攝,才能實現(xiàn)進一步呈現(xiàn)。而這一切的資源限制,隨著openAI Sora近期發(fā)布,讓一切限制有了突破的可能性。
有位github網(wǎng)友AndrewMayne就將 OpenAI 發(fā)布的案例視頻轉(zhuǎn)化成了適用 Vision Pro 的空間視頻。AndrewMayne 創(chuàng)建了兩個視頻軌道,一個用于左眼,一個用于右眼,并根據(jù)視頻移動的方向稍微改變了軌道的時間。這會創(chuàng)建模擬立體 3D 效果,并且僅適用于存在橫向運動的視頻。為了將視頻轉(zhuǎn)換為適用于 Vision Pro 的 Apple Spatial 視頻格式,其使用了 Mike Swansons 的空間視頻轉(zhuǎn)換工具。
Spatial 是一款免費的 macOS 命令行工具,用于處理 MV-HEVC 視頻文件(目前由 iPhone 15 Pro 和 Apple Vision Pro 拍攝形成)。它將 MV-HEVC 文件導出為常見立體格式(例如上/下、左右以及單獨的左眼和右眼視頻),可與標準立體/3D 播放器和視頻編輯器一起使用。它還可以制作相同立體格式的 MV-HEVC 視頻,以便在 Apple Vision Pro 和 Meta Quest 等 XR 硬件設備上播放。
最終經(jīng)過轉(zhuǎn)換的Sora視頻在蘋果 Vision Pro上的實際表現(xiàn)也并不差,雙目視差能夠很好的營造立體感,讓人更加身臨其境。但終歸是網(wǎng)友突發(fā)奇想的操作,加之Sora目前尚不完善,所以相比起Vision Pro 或iPhone 15 Pro 直接拍攝的空間視頻給人的“空間體驗”還是有著不小的差距。
單從空間視頻相關參數(shù)、以及實際觀影 3D 深度、清晰度效果來看,作為原生工具的 Vision Pro 顯然更勝一籌。而 iPhone 15 Pro 的優(yōu)勢則主要體現(xiàn)在其便攜性上,隨時隨地可以拍攝空間視頻。實際在 Vision Pro 上觀看的沉浸感效果與清晰度也相當不錯,遠遠大于在手機上直接觀看的形式,層次感也比較分明。并且通過 AirDrop 還能一鍵投送到 Vision Pro 上,傳輸方式暴力簡單。
但其需要親自拍攝的特點也限制了視頻的內(nèi)容,作為普通人的我們顯然無法拍攝到一些宏大且炫酷的視頻畫面,但AI卻存在無限的可能性。不論是海邊優(yōu)美的風景還是太空激戰(zhàn)的畫面,對AI來說都不算什么難題,而我們也能夠在空間視頻中自由的探索奇幻世界。
觀看過美國著名成人科幻情景喜劇動畫《瑞克和莫蒂》的朋友們應該還記得,動畫中的天才科學家瑞克是一個害羞的如廁者,為了不被打擾和享受如廁,他特意建造了一個風景優(yōu)美的星球,在這顆只屬于他一個人的星球進行如廁活動。而戴上Vision Pro后開啟虛擬場景后,普通人在如廁時也能看到極光環(huán)伺,山川幻景,在上水潺潺間,洗滌時間的污穢。
盡管目前利用Sora 等 AI 大模型生成的視頻、普通視頻通過轉(zhuǎn)換后,缺乏一些層次與深度,在實際觀看中并不是很特別清晰與沉浸。但這些問題不會永遠存在,隨著Sora等AI工具的逐步完善,其量產(chǎn)化、定制化、低門檻的特點將會進一步被放大,從而有效填補XR設備中空間視頻的空白市場。
蘋果與AI的“聯(lián)動”不止空間視頻
目前的蘋果Vision Pro算是一款純粹的MR類空間計算設備,應用生態(tài)中并無太多AI的融合,但在AI的浪潮的沖擊下,蘋果 Vision Pro也將會積極擁抱AI,這并非盲目揣測,而是早已有跡可循。
2月4日,OpenAI通過X平臺的官方貼文向世界宣告:用戶現(xiàn)可在vision OS暢享ChatGPT應用,體驗未來科技的魅力。這款應用在視覺展示上保持了與iPad版相似的清晰界面,盡管未專門為visionOS打造獨特風格,但其在沉浸式頭顯中的表現(xiàn)仍然令人期待。值得一提的是,據(jù)外媒VentureBeat報道,visionOS版的ChatGPT接入了OpenAI最新的GPT-4Turbo模型,這一升級不僅提升了對話體驗,還以更低的成本、更高的響應速率展現(xiàn)出超凡能力。
在蘋果Vision Pro的應用中加入ChatGPT只是對AI初步的擁抱,許多應用可以通過更好的方式與AI進行融合。在Vision Pro中,德國djay音樂軟件和蘋果音樂一起聯(lián)手打造了全新的djay版本,用戶可以在一組虛擬的3D轉(zhuǎn)盤上,通過移動唱針進行不同節(jié)拍的混音制作;還有iPadOS版的DAW錄音軟件,為專業(yè)音樂人士提供實時錄制和演奏。
這類應用可以與AI音樂生成工具Suno進行融合,例如,可以先利用Suno輸入相關提示詞生成AI歌曲,之后通過Vision Pro上的音樂軟件進行調(diào)整與進一步制作,最后使用Pika、PixVerse或者Sora生成視頻,就能創(chuàng)作出一種AI版的音樂MV。
這種AI與XR設備結(jié)合的發(fā)展方式似乎在最新一期的Power On中得到了證實,彭博社的馬克·古爾曼表示蘋果正在考慮是否要開發(fā)智能眼鏡,其中,所述設備可以作為蘋果實現(xiàn)長期夢想的墊腳石。
蘋果Vision Pro的領先是有目共睹的,身為亞洲最大蘋果產(chǎn)品集散地的華強北也在努力追逐蘋果的腳步,但在科技不斷飛躍式前進的當下,曾經(jīng)山寨機的輝煌歲月似乎愈發(fā)的一去不復返了。
AI或?qū)⒊蔀槿A強北XR設備的新出路
在電子消費產(chǎn)品近乎創(chuàng)新停滯、消費動力嚴重不足的背景下,Vision Pro的出現(xiàn)為電子消費市場注入了一劑“強心針”,對虛擬現(xiàn)實硬件和軟件的升級無疑將起到巨大的引導和刺激作用。而如此熱鬧的科技圈“盛會”自然少不了華強北的身影。
一家名為深圳億境虛擬的公司趕在Vision Pro正式發(fā)售的時候推出了高仿版Vision Pro,這為其迅速帶來了熱度。該產(chǎn)品在外形明顯復刻Vison Pro,能夠提供的功能較為基礎,也較少,不過售價僅1000多元,還不到Vision Pro的零頭,這是其主打的優(yōu)勢。
在推出“高仿版”Vision Pro前,華強北正逐漸失去其往日的喧囂,很多路過的行人或進去的消費者對此深有體會,空蕩蕩的過道,緊閉的卷簾門,安靜的市場,走在里面,能看見不少旺鋪出租的標簽。而如今依靠“高仿版”Vision Pro的熱度,華強北似乎也變得熱鬧了起來,但是蘋果較高的技術壁壘讓華強北的廠商們很難復刻出較為出色的可替代產(chǎn)品。
但這本就是華強北的最大弱勢,與其糾結(jié)如何彌補短板,不如發(fā)揮自身的優(yōu)勢,也就是低價和滲透作用。
當初的蘋果AirPods發(fā)布時,過于激進的產(chǎn)品設計讓其一經(jīng)發(fā)布就遭遇冷嘲熱諷,過高的定價更是讓消費者望而卻步。但華強北卻憑借獨到的眼光找到了屬于自身的出路,50-200元的高仿版AirPods利用低價不斷滲透并改變著消費者的使用習慣,而這也為蘋果AirPods的成功起到了一些滲透性的作用,時至今日華強北的AirPods依舊有大批消費者。
作為電子消費市場的風向標,華強北一直是技術潮流的跟隨者。
2016年被虛擬現(xiàn)實概念點燃的VR眼鏡潮流中,在淘寶搜索“VR眼鏡”,大多設備都是價格不到100元的“VR 3D虛擬現(xiàn)實眼鏡”,這些設備大概有一半來自華強北。當時深圳VR設備每個月的出貨量至少有500萬臺,而這個數(shù)字比幾大頭部VR設備制造商的銷量之和還高。數(shù)據(jù)顯示,到2016年年底,Oculus Rift的預計銷量將達到35萬臺,HTC Vive的銷量為42萬臺,谷歌Daydream設備銷量45萬臺,索尼PlayStation VR的表現(xiàn)最好,累計銷量將達到260萬臺。
從上述數(shù)據(jù)可以看出,在國內(nèi),大部分消費者首次接觸虛擬現(xiàn)實技術,正是通過這些來自華強北的低價VR盒子。華強北借助這場風口的薄利多銷,不僅賺的盆滿缽滿還催生出了VR硬件設備的產(chǎn)業(yè)鏈,華強北之所以能迅速推出Vision Pro的山寨產(chǎn)品,與此脫不開關系。
盡管此次的高仿版Vision Pro并未復制2016年VR爆火的盛景,但AI的浪潮或許為華強北帶來了新的出路。不論是Chat-GPT這種AI大語言模型還是Sora、Pika這種文生視頻的AI產(chǎn)品,如果將其植入到設備中或許比起想方設法跨越蘋果的技術壁壘來說反而是一種“捷徑”。
學習國內(nèi)XR廠商的打法,專注細分領域,利用自身的XR設備供應鏈,再植入AI工具,將產(chǎn)品打造成更適合消費者的入門式XR設備,反倒是一條更容易成功的新出路。既然要高仿,不如全都仿,像《幻獸帕魯》一樣,做個“究極縫合怪”。
寫在最后
從生成式人工智能文字對話工具 ChatGPT、圖像生成器 DALL-E,到視頻生成的王炸Sora,OpenAI 正在重塑互聯(lián)網(wǎng)內(nèi)容生產(chǎn)形式。
蘋果Vision Pro則帶來了針對XR領域的空間計算革命,將人們的現(xiàn)實體驗提升到了一個全新的層次。通過結(jié)合 3D 空間場景與混合現(xiàn)實的內(nèi)容展示形式,它不斷地挑戰(zhàn)和刷新人們對于視覺認知的界限。
從目前來看XR設備似乎更像是一張巨大但尚未拼好的拼圖,不論是 ChatGPT和Sora掀起的AI熱,還是高通研發(fā)的XR芯片,抑或是蘋果Vision Pro的推出等等,都在各自的領域拼接著他們的那塊拼圖,而最終將組合到一起促成XR的藍圖,成就元宇宙的虛擬現(xiàn)實時刻。