編譯|芯東西 云鵬
編輯|心緣
芯東西11月15日晚間消息,剛剛,英偉達新一代RTX 40系顯卡的次旗艦GeForce RTX 4080顯卡正式解禁,并將于明天開售,國行售價為9499元。
英偉達這樣的定價也比較明確了,RTX 4080的對標對象就是發(fā)售價為8999元的上代RTX 30系顯卡RTX 3080Ti。
此前在10月的RTX 40系顯卡的發(fā)布會上,英偉達曾分別推出了兩種規(guī)格的RTX 4080顯卡,其配置和定價存在一定爭議。后來英偉達取消了RTX 4080 12GB版本的發(fā)布,后續(xù)大概率會重新調整產(chǎn)品命名。
相比售價12999元的旗艦顯卡RTX 4090,RTX 4080的玩家受眾群體會更加廣泛,并且新一代Ada架構的核心升級、DLSS 3等關鍵游戲特性以及對于AV1編解碼的支持在RTX 4080上均有體現(xiàn)。
值得注意的是,就在本月初,另一家芯片巨頭AMD也秀出了旗艦顯卡新品RX 7000系列,其中RX 7900 XTX 7999元的定價、官稱70%的4K性能提升,勢必會令其成為RTX 4080的有力競爭對手。
這次英偉達給RTX 4080的定位是“最高畫質暢玩4K游戲”,要知道,哪怕是上代發(fā)售價11999元的卡皇RTX 3090都無法在4K最高畫質下以高幀率運行大部分4K 3A大作。如果英偉達所言屬實,那么RTX 4080的確可以說在“性價比”上大幅提升了。
芯東西也作為少數(shù)業(yè)內媒體,提前拿到了RTX 4080公版并進行了幾天的深度測試體驗。先說結論,RTX 4080在游戲、生產(chǎn)力場景中相比RTX 3080Ti最高都有著翻倍式的提升,而且功耗更低、能效比更高。
接下來,芯東西將帶你詳細了解RTX 4080的新特性,以及其在游戲、生產(chǎn)力兩個核心方面的提升情況。在當前消費電子遇冷、芯片行業(yè)承壓的大背景下,英偉達、AMD接連拋出重磅旗艦顯卡,而兩者的新品能否在逆勢下得到市場認可,給業(yè)務注入增長動力,其實際性能表現(xiàn)將至關重要。
01 “體型”看齊4090老大哥溫度表現(xiàn)值得期待
在具體了解特性前,我們不妨先來看一下RTX 4080的外觀。其實此前英偉達的公版顯卡在國內市場并不方便購買,但這次國內電商平臺京東會售賣國行版RTX 40系公版顯卡,國內消費者終于有機會接觸到公版顯卡,因此我們也才有談論公版顯卡外觀的必要。
這次RTX 4080的外觀設計基本與RTX 4090老大哥保持一致,甚至在散熱模具的尺寸上都基本相同,這樣的散熱模具,也能夠充分保證RTX 4080的散熱效果,這一點在后文的測試中我們會進一步聊到。
RTX 4080這次的厚度還是標準的三槽位,電源供電接口采用了16pin供電,包裝內附贈了16pin轉三個8pin的供電轉接線。當然,公版顯卡的長度并沒有顯著增加,實際放在中等甚至較小尺寸的ATX機箱中都可以很好兼容。
RTX 4080背部接口及整體厚度情況
RTX 4080裝在中尺寸ATX機箱中
不過根據(jù)現(xiàn)有信息,非公版的RTX 4080長度和厚度仍然都有比較明顯增加,玩家在選擇時需要提前看好尺寸。
值得一提的是,此前RTX 4090的散熱能力已經(jīng)有些“富?!?,游戲溫度經(jīng)常在60度左右,這次RTX 4080散熱規(guī)格基本相同,功耗更低,其溫度表現(xiàn)更加令人期待。
RTX 4080(下)與RTX 3080Ti(上)的厚度對比
整體來說,英偉達RTX 40系列家族式的硬朗、科技感十足的設計和配色,一直令其相較一眾非公版顯卡更加“不俗”。不知道這次京東的供貨情況如何,如果貨量穩(wěn)定,必然會成為不少玩家的首選。
02 Ada架構秀各種“黑科技”CUDA核心配置留有“余地”
接下來,我們深入RTX 4080的內部,這次在架構的升級方面,RTX 40系顯卡還是有不少亮點值得一提。
當然,大部分新特性,我們在RTX 4090上就已經(jīng)看到了,并不陌生了,而且RTX 4080基本上繼承了老大哥RTX 4090的全部優(yōu)勢項目。
RTX 4080支持的部分新特性一覽
比如我們熟悉的臺積電定制版4nm工藝、SER著色器執(zhí)行重排序技術、第三代光追核心、DLSS 3“幀生成”功能以及當下在生產(chǎn)力視頻渲染領域大火的AV1編解碼支持。
不論是SER還是Ada光流加速器等新技術,如果用比較通俗的話來講,就是讓這些核心在處理跟以前相同的任務時,變得效率更高。同樣時間內,“以前搬一塊磚,現(xiàn)在能搬三塊了”。
根據(jù)英偉達官方數(shù)據(jù),SER能夠讓游戲在光線追蹤下的性能提升3倍,而Ada光流加速器則可以帶來DLSS方面2倍的性能提升。
此外,芯片工藝制程的進步一直是推動芯片能效比提升的核心驅動力之一,這次的RTX 40系列也深受臺積電4nm工藝優(yōu)勢的賦能。
在核心配置方面,RTX 4080上配備了9728個CUDA核心,相比RTX 4090的16384個,減少幅度還是略大的,可以預見,在RTX 4080和RTX 4090之間,很可能還會有類似“RTX 4080Ti”這樣的新型號。
畢竟,老黃的“刀法”,已經(jīng)十分嫻熟。
03 4K游戲幀數(shù)暴漲90%DLSS 3兼顧性能和延遲
俗話說,是騾子是馬,還要拉出來溜溜。作為頂級顯卡,能不能真的像英偉達所說,4K最高畫質玩游戲,是此次體驗RTX 4080的過程中我最為關注的一點。
其實目前大部分主流網(wǎng)游對于配置的要求并不高,比如《英雄聯(lián)盟》和《CS:GO》這樣的游戲,都可以輕松跑到4K 360幀以上,而一些稍微吃一點配置的電競類網(wǎng)游,比如《PUBG》、《永劫無間》、《守望先鋒2》,則很少會有玩家用4K顯示器來玩。
對于大部分射擊類電競網(wǎng)游,為了流暢度,絕大部分玩家會選擇1080P或者2K分辨率顯示器。這次我的目標是要看RTX 4080在4K分辨率下的表現(xiàn),因此我們的重點就放在了單機大作上面,包括一些剛上市的3A單機游戲。
部分參測游戲
在這些測試中,我們并沒有特別關注傳統(tǒng)光柵渲染性能,也就是關閉DLSS后的幀數(shù),這里有必要說明一下。
實際上,目前英偉達DLSS技術經(jīng)過多輪迭代,如今在最新版本中,畫質的損失已經(jīng)基本可以忽略不計,開啟DLSS功能基本上已經(jīng)等于“獲得免費性能提升”,而且這種提升往往是翻倍式的,因此普通玩家沒有不開啟的理由。
最主要的是,得益于英偉達的強大的生態(tài)號召力,如今幾乎所有新發(fā)售的主流PC游戲均已支持DLSS技術,尤其是近年來的國產(chǎn)單機游戲,對于DLSS技術的支持都十分積極,比如《暗影火炬城》、《光明記憶:無限》、《生死輪回》等游戲甚至已經(jīng)支持了最新的DLSS 3。
到11月15日,已經(jīng)有十余款游戲支持了DLSS 3,而首批宣布支持DLSS 3的游戲已經(jīng)超過了35款,生態(tài)推進速度十分可觀。
可以說,DLSS不僅好用,而且是一個絕大部分用戶都可以用到,在游戲中真正用起來的功能,而不支持DLSS的游戲,往往本身幀數(shù)已經(jīng)很高了,例如一些電競網(wǎng)游。
因此我們這次的測試均在開啟DLSS的模式下進行,RTX 4080可以開啟最新的DLSS 3,而作為對比的RTX 3080Ti則開啟DLSS 2,具體DLSS 2的版本根據(jù)游戲可能會有所不同。
不過為了滿足大家的好奇,在測試DLSS游戲前,我還是先跑了一下傳統(tǒng)的3DMark測試軟件中的Time Spy Extreme測試,這個項目測試的是顯卡在4K下的傳統(tǒng)光柵渲染性能,根據(jù)最終成績,RTX 4080大約領先RTX 3080Ti 41%左右。
3DMark TSE測試,左:RTX 4080,右:RTX 3080Ti
回到DLSS游戲表現(xiàn),最新的DLSS 3是我此次體驗的重點,核心就是要看,幀數(shù)提升幅度有多少,而畫面是否會因為幀是“生成”的而有劣化現(xiàn)象,或者不真實的效果出現(xiàn)。
提到DLSS 3,《賽博朋克2077》基本上屬于PC端的“原神”,是每個顯卡的傳統(tǒng)必測項目,在這個游戲中,RTX 4080的提升幅度超過了90%,接近翻倍。
開啟DLSS后幀數(shù)對比
游戲幀數(shù)直接從RTX 3080Ti的60幀“可玩”水平,變成了RTX 4080的115幀“電競”水平。
在游戲內的流暢度提升感知是非常明顯的,這種感覺就像從60Hz的手機換到120Hz手機時帶來的流暢度提升。
并且值得注意的是,在仔細對比開啟DLSS 3和普通DLSS 2兩種模式下畫面時,我并沒有發(fā)現(xiàn)明顯不同,或者更準確的說,如果盲測,我是完全分辨不出來兩者之間的差別的。
《賽博朋克2077》,左:DLSS 3,右:DLSS 2
《賽博朋克2077》,左:DLSS 3,右:DLSS 2
可以說,DLSS 3在帶來大幅幀數(shù)提升的基礎上,并沒有犧牲畫質。
在3DMark軟件中針對性的DLSS性能測試中,RTX 4080相比RTX 3080Ti的提升幅度超過了80%,這一成績也可作為DLSS 3在游戲中能夠帶來的平均幀數(shù)提升的參考值。
3D Mark DLSS測試
還有一點是不少人都關心的延遲問題,因為畫面中的幀是“生成”的,因此會不會有更大延遲呢?實際上,DLSS 3功能開啟后,系統(tǒng)中我們還可以開啟英偉達獨有的Reflex延遲優(yōu)化功能,而DLSS 3與Reflex功能是深度綁定的,在游戲中只要開啟DLSS 3,就會自動打開Reflex功能。
在實際游戲過程中,DLSS 3+Reflex模式下,游戲的延遲甚至比普通關閉Reflex模式下的延遲更低。也就是說,DLSS 3配合Reflex功能,實現(xiàn)了幀數(shù)提升和延遲降低的兼顧。
幾款測試游戲中開關Reflex延遲(毫秒)對比
可以說是“魚和熊掌兼得”,這一點還是比較令我驚喜的。
3DMark DLSS測試畫面對比,左:DLSS 3,右:DLSS 2
《瘟疫傳說:安魂曲》DLSS畫面對比,左:DLSS 3,右:DLSS 2
值得一提的是,在《暗影火炬城》游戲中,DLSS 3畫面給人的第一觀感反而更“純凈”,相比之下DLSS 2畫面噪點更多,部分物體邊緣“毛刺感”稍明顯。
《暗影火炬城》DLSS畫面對比,左:DLSS 3,右:DLSS 2
回到游戲幀數(shù)的提升,在最新的3A大作《瘟疫傳說:安魂曲》中,RTX 4080的提升幅度也來到了76%,提升幅度比較明顯。
《瘟疫傳說:安魂曲》游戲畫面
另外,在《幻塔》、《生死輪回》、《光明記憶:無限》等幾款單機游戲中,RTX 4080的幀數(shù)提升幅度在40%-60%左右。在測試游戲中,《毀滅全人類2》和《暗影火炬城》提升幅度分別為26%和28%。
均開啟DLSS功能
雖然提升幅度沒有其他游戲大,但實際上,這兩款游戲的實際游戲幀數(shù)已經(jīng)達到了170幀、180幀左右,已經(jīng)可以完全滿足主流4K 144顯示器“滿幀”運行。
另外值得一提的是,除了游戲平均幀數(shù)的提升,在1%最低幀方面,RTX 4080的提升更加明顯,比如在《賽博朋克2077》中,1%最低幀從RTX 3080Ti的48幀直接提升到了99幀,翻了一倍還多。
這樣的翻倍式1%最低幀提升,在《瘟疫傳說:安魂曲》、《光明記憶:無限》、《幻塔》、《生死輪回》等游戲中均有體現(xiàn)。
其實在實際游戲中,1%最低幀是非常影響游戲體驗的,偶發(fā)性的幀數(shù)降低,反映在實際游戲中就是突發(fā)的“卡頓”。在這次的實際游戲體驗中,最直觀的一個感受就是,RTX 4080發(fā)生偶發(fā)性卡頓的次數(shù)要遠遠少于RTX 3080Ti。
比如《幻塔》這款游戲,其首發(fā)在手機、平板端,近期適配PC,優(yōu)化時間較短,并且PC端支持光追等特效,畫面效果較為絢麗,因此對PC硬件性能也有不低的需求,在這類游戲中,RTX 4080的偶發(fā)性卡頓要明顯少于RTX 3080Ti。
《幻塔》
RTX 4080的游戲流暢度體驗要明顯優(yōu)于RTX 3080Ti,提升還是比較明顯的,這種平均幀與1%最低幀的同步大幅提升,可以真正給游戲體驗帶來“質變”,這一點是RTX 4080在游戲方面最有價值的提升之一。
RTX 4080在4K最高畫質開啟DLSS 3后的游戲幀數(shù)表現(xiàn)
綜合來看,英偉達RTX 4080的確兌現(xiàn)了“最高畫質暢玩4K游戲”的承諾,幾款游戲的平均幀都來到了155左右,可以完全“跑滿”4K 144Hz高端電競顯示器,即使是最低幀也來到了平均114幀左右。
說實話,這樣的性能提升幅度,我們只有在RTX 4090和RTX 3090Ti的對比中看到過。
04 視頻渲染效率翻倍,支持最新AV1編解碼
聊完了核心的游戲場景,生產(chǎn)力場景也是不能少的,畢竟,RTX 4080、RTX 4090這種旗艦、次旗艦級別的顯卡都配備了大容量顯存,這對于視頻渲染等場景來說都是不可或缺的。
這次在RTX 40系顯卡上,英偉達也加入了最新的AV1編解碼支持,簡單理解,AV1編解碼已經(jīng)逐漸應用于各大主流視頻平臺,最直觀的效果就是用更少的數(shù)據(jù)量傳輸更高質量的視頻,因此支持這一技術的意義不言而喻。
我也重點測試了AV1和H.265兩種編解碼的視頻導出渲染。在實際測試中,同樣導出一段大小12GB、時長2分鐘的4K 30幀視頻,在H.265格式下,RTX 4080的用時為15分鐘,而RTX 3080Ti用時則為34分鐘,提升幅度達到一倍以上。
而同樣一段視頻,RTX 4080在AV1格式下的導出時間僅為14秒,速度同樣很快。
達芬奇視頻AV1編解碼導出渲染測試
當視頻分辨率來到8K時,同樣一段視頻,H.265格式下RTX 3080Ti的導出時間為126秒,而RTX 4080僅有54秒,提升幅度依然保持在一倍以上。
可以說,針對核心的生產(chǎn)力場景,RTX 4080的發(fā)揮空間很大,尤其是在視頻渲染等場景中,對于效率的提升是非常明顯的。
05 能效比成“殺手锏”,功耗溫度控制亮眼
整體看下來,RTX 4080在游戲和生產(chǎn)力場景中的表現(xiàn)都令人驚喜,那么現(xiàn)在問題來了,這樣的性能提升,需要有什么犧牲呢?是功耗還是溫度?
要知道,如今談及芯片,大家最關心的三個字莫過于“能效比”,只要功耗高,性能再強都會顯得“黯然失色”。
不過RTX 4080這次著實沒有令人失望。在游戲實際測試中,RTX 4080的平均功耗僅有260W左右,甚至沒有一款游戲會達到300W功耗。但相比之下,跑同樣的幾款游戲,RTX 3080Ti的功耗卻在340W左右。
游戲功耗數(shù)據(jù),單位:瓦
也就是說,在性能提升一半以上的同時,RTX 4080的功耗還平均下降了四分之一左右,能效比提升十分明顯。
即使在3DMark的Time Spy Extreme循環(huán)壓力測試中,顯卡在100%占用的滿載狀態(tài)下,也僅出現(xiàn)了313W左右的功耗。
3DMark Time Spy Extreme循環(huán)壓力測試功耗表現(xiàn)
在GPU-Z中我們可以看到,RTX 4080公版的默認功耗為320W,功耗最大值僅為355W,與RTX 3080Ti默認功耗350W基本相同。
GPU-Z默認功耗對比
在功耗如此低的基礎上,顯卡溫度自然也控制的比較優(yōu)秀,在游戲測試的全過程中,RTX 4080幾乎都在60度以下,大部分游戲的溫度都在55到57度左右,顯卡外殼即使用手觸摸都只能感覺到“溫熱”。
游戲溫度表現(xiàn),單位:攝氏度
相比之下,RTX 3080Ti的溫度則基本在70度以上,大多在72到75度左右浮動,溫度也不算高,但相比RTX 4080出色的能效比、高規(guī)格散熱模塊所帶來的溫度表現(xiàn),還是要遜色不少。
可以說,RTX 4080的溫度表現(xiàn)令人驚喜。
最后來到超頻環(huán)節(jié),其實目前旗艦級顯卡的性能基本上已經(jīng)在出廠時就已經(jīng)被廠商調整至能效比最優(yōu)的狀態(tài),因此超頻的空間并不大,而超頻很可能帶來功耗和溫度的大幅上漲,但游戲幀數(shù)卻提升有限,有些得不償失。
因此我這次只模擬了普通玩家進行入門級簡單超頻,在Afterburner軟件中,我將顯卡功耗和溫度拉滿,將頻率拉高了50MHz,顯存頻率拉高了100MHz。
Afterburner調整值
這樣一番最基礎的調整后,顯卡在3DMark的Time Spy Extreme測試中的成績從13838分提升至14146分,提升2%左右。不過值得注意的是,顯卡在小幅超頻后,溫度幾乎沒有明顯提升。
小幅超頻后RTX 4080的TSE測試成績
可以想象,在看齊RTX 4090的旗艦級散熱規(guī)格、更低的功耗基礎上,RTX 4080應該有一定的超頻空間,對于喜歡折騰的玩家,應該還會有更多可玩性。
06 結語:英偉達用AI讓4K游戲“大眾化”
綜合看下來,RTX 4080在相比同價位段RTX 3080Ti性能翻倍的基礎上,價格卻幾乎相同,能效比更為出色,同時對最新Ada架構的眾多新特性都予以支持,可以說,這款次旗艦顯卡,幾乎已經(jīng)實現(xiàn)了4K游戲的“通吃”。
而在這樣的游戲體驗背后,基于AI的DLSS 3功能是關鍵技術,AI的融入,讓游戲顯卡開始有能力主動“生成”游戲畫面幀,仿佛讓顯卡擁有了“思考”的能力,這一點難能可貴,也不由得令我們感嘆AI技術對各領域賦能的潛力之高。
正如英偉達CEO黃仁勛所說,英偉達是一家人工智能公司,此言非虛。
另一邊,AMD在兩周前發(fā)布了RX 7000系列顯卡,旗艦款RX 7900 XTX 7999元的定價,顯然會使其成為RTX 4080強有力的競爭對手,屆時“紅綠”兩隊的較量會有怎樣的結果,也必然成為業(yè)內關注的焦點。
但無論如何,在消費電子市場遇冷的大背景下,PC銷量下滑,英偉達必然將會面臨不小的挑戰(zhàn),RTX 40系列能否對游戲業(yè)務起到很好的提振作用,還有待市場檢驗。