文|Metaverse元宇宙 孫浩南
大家都知道剛剛過(guò)去的2023年中AI被評(píng)為年度熱詞,其中OpenAI功不可沒(méi),其推出的Chat-GPT一炮而紅,微軟的Copilot、谷歌的Bard、文心一言、通義千問(wèn)等其他AI產(chǎn)品緊隨其后,各家企業(yè)共同創(chuàng)造出了AI的第一波浪潮。
今年剛開(kāi)年,蘋(píng)果Vision Pro的發(fā)售為XR領(lǐng)域帶來(lái)了“空間計(jì)算”的概念。蘋(píng)果的熱度還未消退,OpenAI推出的Sora就帶來(lái)了AI的第二波浪潮,而在這波濤滾滾的AI浪潮中,我們似乎看到了蘋(píng)果與OpenAI“聯(lián)動(dòng)”的未來(lái)雛形。
Sora掀起了AI的第二波浪潮
OpenAI在2023年推出了Chat-GPT,自此掀起了第一波AI熱潮,眾多大廠(chǎng)也攜帶著自家AI產(chǎn)品紛至沓來(lái)。你方唱罷我登場(chǎng)的現(xiàn)象讓大模型加持的AI浪潮徹底成勢(shì),而現(xiàn)在,OpenAI的Sora又成功掀起了AI的第二波浪潮。
Sora取自日語(yǔ)單詞,意為“天空”,引申含義還有“自由”。在Sora官網(wǎng)頁(yè)面,無(wú)數(shù)只紙飛機(jī)在自由飛翔,行動(dòng)自主,最后匯集成一片天空的背景色。
Sora的核心技術(shù)在于其先進(jìn)的文本到視頻轉(zhuǎn)換算法與對(duì)現(xiàn)實(shí)物理世界的高理解度。使其能夠精準(zhǔn)理解輸入的文本描述,并自動(dòng)生成與之匹配的高質(zhì)量視頻。Sora讓“一句話(huà)(prompt)生成視頻”成為可能。這種能力的震撼之處在于, Sora在模擬物理世界時(shí),能夠更準(zhǔn)確地反映出現(xiàn)實(shí)世界的復(fù)雜性和多樣性。在OpenAI發(fā)布的宣傳視頻中,Sora展現(xiàn)出了出色的圖像生成能力和流暢的視頻編輯技巧,無(wú)論是細(xì)節(jié)刻畫(huà)還是整體風(fēng)格把握,都展現(xiàn)出了極高的水準(zhǔn)。
其實(shí)此前并非沒(méi)有類(lèi)似的文生視頻AI工具,曾經(jīng)以“富二代、美女、高材生、創(chuàng)始人”多種網(wǎng)紅標(biāo)簽而爆火的Pika Labs也讓AI界震驚了一把。但不論是它還是Runway、Pika、SVD(Stable Video Diffusion)、谷歌和 Meta等眾多同類(lèi)產(chǎn)品,都只是小范圍的“驚艷”,直到OpenAI下場(chǎng)才成功掀起AI的第二波熱潮。
這場(chǎng)AI的浪潮滾滾而來(lái),途中竟然與蘋(píng)果Vision Pro來(lái)了一次跨界“聯(lián)動(dòng)”。
AI浪潮助推Vision Pro生態(tài)
蘋(píng)果Vision pro發(fā)售后,一躍成為迄今最先進(jìn)的虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)眼鏡,蘋(píng)果公司將其稱(chēng)為“空間計(jì)算設(shè)備”。OpenAI的創(chuàng)始人兼CEO山姆·奧特曼評(píng)價(jià):蘋(píng)果Vision pro是自iPhone以后第二驚艷的技術(shù)。
Vision pro出現(xiàn)讓空間計(jì)算這個(gè)詞得到現(xiàn)實(shí)中完美呈現(xiàn),簡(jiǎn)單說(shuō)將我們周?chē)默F(xiàn)實(shí)物理世界和虛擬世界無(wú)縫整合,實(shí)現(xiàn)毫無(wú)違和感的沉浸式互動(dòng)體驗(yàn)。其中的空間視頻功能更是讓眾人深感震撼,在“蝴蝶落在指尖”的演示中Vision Pro能夠準(zhǔn)確地為每個(gè)人確定他們的手指所在的位置,并使蝴蝶準(zhǔn)確地落在他們的指尖上。一個(gè)評(píng)測(cè)者形容:“你甚至可以清晰地看到指尖上蝴蝶的觸手和絨毛,這讓我感覺(jué)有點(diǎn)起雞皮疙瘩”。
每一個(gè)空間視頻都帶給人們一種獨(dú)特的沉浸感,但可惜的是虛擬世界的搭建上和3D電影 沉浸式影片照片體驗(yàn),現(xiàn)階段都是基于VisionPro頭顯專(zhuān)用流媒體資源(至今為止可以訪(fǎng)問(wèn)僅150 深度的3D娛樂(lè)項(xiàng)目),且需要依賴(lài)于強(qiáng)大的虛擬世界搭建引擎和海量可支持3D的視頻模型資源, 哪怕是內(nèi)置的3D攝像頭可以拍攝照片或視頻,但也需要用戶(hù)自主去捕捉拍攝,才能實(shí)現(xiàn)進(jìn)一步呈現(xiàn)。而這一切的資源限制,隨著openAI Sora近期發(fā)布,讓一切限制有了突破的可能性。
有位github網(wǎng)友AndrewMayne就將 OpenAI 發(fā)布的案例視頻轉(zhuǎn)化成了適用 Vision Pro 的空間視頻。AndrewMayne 創(chuàng)建了兩個(gè)視頻軌道,一個(gè)用于左眼,一個(gè)用于右眼,并根據(jù)視頻移動(dòng)的方向稍微改變了軌道的時(shí)間。這會(huì)創(chuàng)建模擬立體 3D 效果,并且僅適用于存在橫向運(yùn)動(dòng)的視頻。為了將視頻轉(zhuǎn)換為適用于 Vision Pro 的 Apple Spatial 視頻格式,其使用了 Mike Swansons 的空間視頻轉(zhuǎn)換工具。
Spatial 是一款免費(fèi)的 macOS 命令行工具,用于處理 MV-HEVC 視頻文件(目前由 iPhone 15 Pro 和 Apple Vision Pro 拍攝形成)。它將 MV-HEVC 文件導(dǎo)出為常見(jiàn)立體格式(例如上/下、左右以及單獨(dú)的左眼和右眼視頻),可與標(biāo)準(zhǔn)立體/3D 播放器和視頻編輯器一起使用。它還可以制作相同立體格式的 MV-HEVC 視頻,以便在 Apple Vision Pro 和 Meta Quest 等 XR 硬件設(shè)備上播放。
最終經(jīng)過(guò)轉(zhuǎn)換的Sora視頻在蘋(píng)果 Vision Pro上的實(shí)際表現(xiàn)也并不差,雙目視差能夠很好的營(yíng)造立體感,讓人更加身臨其境。但終歸是網(wǎng)友突發(fā)奇想的操作,加之Sora目前尚不完善,所以相比起Vision Pro 或iPhone 15 Pro 直接拍攝的空間視頻給人的“空間體驗(yàn)”還是有著不小的差距。
單從空間視頻相關(guān)參數(shù)、以及實(shí)際觀影 3D 深度、清晰度效果來(lái)看,作為原生工具的 Vision Pro 顯然更勝一籌。而 iPhone 15 Pro 的優(yōu)勢(shì)則主要體現(xiàn)在其便攜性上,隨時(shí)隨地可以拍攝空間視頻。實(shí)際在 Vision Pro 上觀看的沉浸感效果與清晰度也相當(dāng)不錯(cuò),遠(yuǎn)遠(yuǎn)大于在手機(jī)上直接觀看的形式,層次感也比較分明。并且通過(guò) AirDrop 還能一鍵投送到 Vision Pro 上,傳輸方式暴力簡(jiǎn)單。
但其需要親自拍攝的特點(diǎn)也限制了視頻的內(nèi)容,作為普通人的我們顯然無(wú)法拍攝到一些宏大且炫酷的視頻畫(huà)面,但AI卻存在無(wú)限的可能性。不論是海邊優(yōu)美的風(fēng)景還是太空激戰(zhàn)的畫(huà)面,對(duì)AI來(lái)說(shuō)都不算什么難題,而我們也能夠在空間視頻中自由的探索奇幻世界。
觀看過(guò)美國(guó)著名成人科幻情景喜劇動(dòng)畫(huà)《瑞克和莫蒂》的朋友們應(yīng)該還記得,動(dòng)畫(huà)中的天才科學(xué)家瑞克是一個(gè)害羞的如廁者,為了不被打擾和享受如廁,他特意建造了一個(gè)風(fēng)景優(yōu)美的星球,在這顆只屬于他一個(gè)人的星球進(jìn)行如廁活動(dòng)。而戴上Vision Pro后開(kāi)啟虛擬場(chǎng)景后,普通人在如廁時(shí)也能看到極光環(huán)伺,山川幻景,在上水潺潺間,洗滌時(shí)間的污穢。
盡管目前利用Sora 等 AI 大模型生成的視頻、普通視頻通過(guò)轉(zhuǎn)換后,缺乏一些層次與深度,在實(shí)際觀看中并不是很特別清晰與沉浸。但這些問(wèn)題不會(huì)永遠(yuǎn)存在,隨著Sora等AI工具的逐步完善,其量產(chǎn)化、定制化、低門(mén)檻的特點(diǎn)將會(huì)進(jìn)一步被放大,從而有效填補(bǔ)XR設(shè)備中空間視頻的空白市場(chǎng)。
蘋(píng)果與AI的“聯(lián)動(dòng)”不止空間視頻
目前的蘋(píng)果Vision Pro算是一款純粹的MR類(lèi)空間計(jì)算設(shè)備,應(yīng)用生態(tài)中并無(wú)太多AI的融合,但在AI的浪潮的沖擊下,蘋(píng)果 Vision Pro也將會(huì)積極擁抱AI,這并非盲目揣測(cè),而是早已有跡可循。
2月4日,OpenAI通過(guò)X平臺(tái)的官方貼文向世界宣告:用戶(hù)現(xiàn)可在vision OS暢享ChatGPT應(yīng)用,體驗(yàn)未來(lái)科技的魅力。這款應(yīng)用在視覺(jué)展示上保持了與iPad版相似的清晰界面,盡管未專(zhuān)門(mén)為visionOS打造獨(dú)特風(fēng)格,但其在沉浸式頭顯中的表現(xiàn)仍然令人期待。值得一提的是,據(jù)外媒VentureBeat報(bào)道,visionOS版的ChatGPT接入了OpenAI最新的GPT-4Turbo模型,這一升級(jí)不僅提升了對(duì)話(huà)體驗(yàn),還以更低的成本、更高的響應(yīng)速率展現(xiàn)出超凡能力。
在蘋(píng)果Vision Pro的應(yīng)用中加入ChatGPT只是對(duì)AI初步的擁抱,許多應(yīng)用可以通過(guò)更好的方式與AI進(jìn)行融合。在Vision Pro中,德國(guó)djay音樂(lè)軟件和蘋(píng)果音樂(lè)一起聯(lián)手打造了全新的djay版本,用戶(hù)可以在一組虛擬的3D轉(zhuǎn)盤(pán)上,通過(guò)移動(dòng)唱針進(jìn)行不同節(jié)拍的混音制作;還有iPadOS版的DAW錄音軟件,為專(zhuān)業(yè)音樂(lè)人士提供實(shí)時(shí)錄制和演奏。
這類(lèi)應(yīng)用可以與AI音樂(lè)生成工具Suno進(jìn)行融合,例如,可以先利用Suno輸入相關(guān)提示詞生成AI歌曲,之后通過(guò)Vision Pro上的音樂(lè)軟件進(jìn)行調(diào)整與進(jìn)一步制作,最后使用Pika、PixVerse或者Sora生成視頻,就能創(chuàng)作出一種AI版的音樂(lè)MV。
這種AI與XR設(shè)備結(jié)合的發(fā)展方式似乎在最新一期的Power On中得到了證實(shí),彭博社的馬克·古爾曼表示蘋(píng)果正在考慮是否要開(kāi)發(fā)智能眼鏡,其中,所述設(shè)備可以作為蘋(píng)果實(shí)現(xiàn)長(zhǎng)期夢(mèng)想的墊腳石。
蘋(píng)果Vision Pro的領(lǐng)先是有目共睹的,身為亞洲最大蘋(píng)果產(chǎn)品集散地的華強(qiáng)北也在努力追逐蘋(píng)果的腳步,但在科技不斷飛躍式前進(jìn)的當(dāng)下,曾經(jīng)山寨機(jī)的輝煌歲月似乎愈發(fā)的一去不復(fù)返了。
AI或?qū)⒊蔀槿A強(qiáng)北XR設(shè)備的新出路
在電子消費(fèi)產(chǎn)品近乎創(chuàng)新停滯、消費(fèi)動(dòng)力嚴(yán)重不足的背景下,Vision Pro的出現(xiàn)為電子消費(fèi)市場(chǎng)注入了一劑“強(qiáng)心針”,對(duì)虛擬現(xiàn)實(shí)硬件和軟件的升級(jí)無(wú)疑將起到巨大的引導(dǎo)和刺激作用。而如此熱鬧的科技圈“盛會(huì)”自然少不了華強(qiáng)北的身影。
一家名為深圳億境虛擬的公司趕在Vision Pro正式發(fā)售的時(shí)候推出了高仿版Vision Pro,這為其迅速帶來(lái)了熱度。該產(chǎn)品在外形明顯復(fù)刻Vison Pro,能夠提供的功能較為基礎(chǔ),也較少,不過(guò)售價(jià)僅1000多元,還不到Vision Pro的零頭,這是其主打的優(yōu)勢(shì)。
在推出“高仿版”Vision Pro前,華強(qiáng)北正逐漸失去其往日的喧囂,很多路過(guò)的行人或進(jìn)去的消費(fèi)者對(duì)此深有體會(huì),空蕩蕩的過(guò)道,緊閉的卷簾門(mén),安靜的市場(chǎng),走在里面,能看見(jiàn)不少旺鋪出租的標(biāo)簽。而如今依靠“高仿版”Vision Pro的熱度,華強(qiáng)北似乎也變得熱鬧了起來(lái),但是蘋(píng)果較高的技術(shù)壁壘讓華強(qiáng)北的廠(chǎng)商們很難復(fù)刻出較為出色的可替代產(chǎn)品。
但這本就是華強(qiáng)北的最大弱勢(shì),與其糾結(jié)如何彌補(bǔ)短板,不如發(fā)揮自身的優(yōu)勢(shì),也就是低價(jià)和滲透作用。
當(dāng)初的蘋(píng)果AirPods發(fā)布時(shí),過(guò)于激進(jìn)的產(chǎn)品設(shè)計(jì)讓其一經(jīng)發(fā)布就遭遇冷嘲熱諷,過(guò)高的定價(jià)更是讓消費(fèi)者望而卻步。但華強(qiáng)北卻憑借獨(dú)到的眼光找到了屬于自身的出路,50-200元的高仿版AirPods利用低價(jià)不斷滲透并改變著消費(fèi)者的使用習(xí)慣,而這也為蘋(píng)果AirPods的成功起到了一些滲透性的作用,時(shí)至今日華強(qiáng)北的AirPods依舊有大批消費(fèi)者。
作為電子消費(fèi)市場(chǎng)的風(fēng)向標(biāo),華強(qiáng)北一直是技術(shù)潮流的跟隨者。
2016年被虛擬現(xiàn)實(shí)概念點(diǎn)燃的VR眼鏡潮流中,在淘寶搜索“VR眼鏡”,大多設(shè)備都是價(jià)格不到100元的“VR 3D虛擬現(xiàn)實(shí)眼鏡”,這些設(shè)備大概有一半來(lái)自華強(qiáng)北。當(dāng)時(shí)深圳VR設(shè)備每個(gè)月的出貨量至少有500萬(wàn)臺(tái),而這個(gè)數(shù)字比幾大頭部VR設(shè)備制造商的銷(xiāo)量之和還高。數(shù)據(jù)顯示,到2016年年底,Oculus Rift的預(yù)計(jì)銷(xiāo)量將達(dá)到35萬(wàn)臺(tái),HTC Vive的銷(xiāo)量為42萬(wàn)臺(tái),谷歌Daydream設(shè)備銷(xiāo)量45萬(wàn)臺(tái),索尼PlayStation VR的表現(xiàn)最好,累計(jì)銷(xiāo)量將達(dá)到260萬(wàn)臺(tái)。
從上述數(shù)據(jù)可以看出,在國(guó)內(nèi),大部分消費(fèi)者首次接觸虛擬現(xiàn)實(shí)技術(shù),正是通過(guò)這些來(lái)自華強(qiáng)北的低價(jià)VR盒子。華強(qiáng)北借助這場(chǎng)風(fēng)口的薄利多銷(xiāo),不僅賺的盆滿(mǎn)缽滿(mǎn)還催生出了VR硬件設(shè)備的產(chǎn)業(yè)鏈,華強(qiáng)北之所以能迅速推出Vision Pro的山寨產(chǎn)品,與此脫不開(kāi)關(guān)系。
盡管此次的高仿版Vision Pro并未復(fù)制2016年VR爆火的盛景,但AI的浪潮或許為華強(qiáng)北帶來(lái)了新的出路。不論是Chat-GPT這種AI大語(yǔ)言模型還是Sora、Pika這種文生視頻的AI產(chǎn)品,如果將其植入到設(shè)備中或許比起想方設(shè)法跨越蘋(píng)果的技術(shù)壁壘來(lái)說(shuō)反而是一種“捷徑”。
學(xué)習(xí)國(guó)內(nèi)XR廠(chǎng)商的打法,專(zhuān)注細(xì)分領(lǐng)域,利用自身的XR設(shè)備供應(yīng)鏈,再植入AI工具,將產(chǎn)品打造成更適合消費(fèi)者的入門(mén)式XR設(shè)備,反倒是一條更容易成功的新出路。既然要高仿,不如全都仿,像《幻獸帕魯》一樣,做個(gè)“究極縫合怪”。
寫(xiě)在最后
從生成式人工智能文字對(duì)話(huà)工具 ChatGPT、圖像生成器 DALL-E,到視頻生成的王炸Sora,OpenAI 正在重塑互聯(lián)網(wǎng)內(nèi)容生產(chǎn)形式。
蘋(píng)果Vision Pro則帶來(lái)了針對(duì)XR領(lǐng)域的空間計(jì)算革命,將人們的現(xiàn)實(shí)體驗(yàn)提升到了一個(gè)全新的層次。通過(guò)結(jié)合 3D 空間場(chǎng)景與混合現(xiàn)實(shí)的內(nèi)容展示形式,它不斷地挑戰(zhàn)和刷新人們對(duì)于視覺(jué)認(rèn)知的界限。
從目前來(lái)看XR設(shè)備似乎更像是一張巨大但尚未拼好的拼圖,不論是 ChatGPT和Sora掀起的AI熱,還是高通研發(fā)的XR芯片,抑或是蘋(píng)果Vision Pro的推出等等,都在各自的領(lǐng)域拼接著他們的那塊拼圖,而最終將組合到一起促成XR的藍(lán)圖,成就元宇宙的虛擬現(xiàn)實(shí)時(shí)刻。