OpenAI發(fā)布第一個文生視頻大模型Sora,立刻引發(fā)了廣泛的關(guān)注和探討。2月19日,獵豹移動董事長兼CEO、獵戶星空董事長傅盛受邀做客央視財經(jīng)2024年的全新專欄直播節(jié)目《光華錄》,與主持人周運、財經(jīng)科技觀察員、中國通信標(biāo)準(zhǔn)化協(xié)會互動媒體標(biāo)準(zhǔn)推進工作委員會的副主席包冉一道,圍繞Sora展開一場對話。
在節(jié)目中,傅盛表示,Sora的出現(xiàn)證明了文生視頻技術(shù)已經(jīng)可以達到以假亂真的程度,這是一個里程碑式的突破。他認(rèn)為,雖然Sora是一次產(chǎn)品級的成功,但真正的大語言模型才是技術(shù)上的重大突破。傅盛解釋說,Sora能夠達到以假亂真的效果,是因為大語言模型的出現(xiàn)復(fù)刻了人類的推理和直覺,使得Sora能夠通過直覺把物理世界展現(xiàn)出來。
從技術(shù)的角度來看,傅盛認(rèn)為,Sora并沒有在技術(shù)上有什么重大突破,而是采用了更大的算力和更好的工程化,“你可以把它理解成更好的工程化,采用了更大的算力,可以總結(jié)成一個成語叫熟能生巧。我們以前建模是為了通過一個物理引擎去模擬真實的世界,但是還有一種方式,不需要通過一個物理引擎,就算是一個普通人,天天畫,就跟畫雞蛋一樣,我一畫就有了立體感,熟能生巧。我腦子里并沒有物理方程式,但是因為我見了很多以后,我就形成直覺了。由于這次大語言模型的出現(xiàn),把以前人的那種推理和直覺給復(fù)刻出來,所以這一次Sora從技術(shù)層面來說,也是特別得益于大語言模型的出現(xiàn),使得它沒有去建一個純粹的物理模型,但是能夠通過直覺把物理世界展現(xiàn)出來?!?/span>
在文生圖領(lǐng)域,Sora并不是簡單地找了一個近似的人,而是創(chuàng)造出了一個全新的人物。這一點在文生圖領(lǐng)域已經(jīng)有了先例。比如,讓Sora創(chuàng)造一個美女,這個人物在現(xiàn)實世界中可能從未出現(xiàn)過,但是看起來卻符合觀眾的審美標(biāo)準(zhǔn)。此外,觀察OpenAI發(fā)布的視頻,可以發(fā)現(xiàn)其中一些地方有些取巧,或者說是故意讓觀眾感到震驚。比如,水面倒影和雪的質(zhì)感等。雖然我們認(rèn)為最難的是光影效果,但對于大模型或者圖像引擎來說,畫一個普通雞蛋和描繪晚上水面的倒影沒有本質(zhì)區(qū)別。我們之所以感覺到區(qū)別,是因為我們受限于使用的器材和我們的認(rèn)知積累。換句話說,對于一個小孩來說,黑夜和白天在視覺上并沒有本質(zhì)區(qū)別。
傅盛認(rèn)為“這相當(dāng)于它又打開了一扇門”,“文成視頻能做的這么好,很快很多人都會進入,我昨天還專門跟我們在美國的同事做了探討,覺得它并不是一個獨一無二的技術(shù),未來會出現(xiàn)很多這樣的工具?!?/span>
在討論硬件層面時,傅盛提到,算力的成本在持續(xù)下降,類比汽車剛出現(xiàn)時汽油價格的下降。他表示,即使算法沒有更新,算力的成本也會急劇下降。他還指出,今年出現(xiàn)的新CPU都會帶有一個推理算力的子芯片,這種趨勢將使得大模型的應(yīng)用變得更加普及。
【廣告】(免責(zé)聲明:本文為本網(wǎng)站出于傳播商業(yè)信息之目的進行轉(zhuǎn)載發(fā)布,不代表本網(wǎng)站的觀點及立場。本文所涉文、圖、音視頻等資料之一切權(quán)利和法律責(zé)任歸材料提供方所有和承擔(dān)。本網(wǎng)站對此資訊文字、圖片等所有信息的真實性不作任何保證或承諾,亦不構(gòu)成任何購買、投資等建議,據(jù)此操作者風(fēng)險自擔(dān)。)