正在閱讀:

從單核到多核,服務器CPU風云再起

掃一掃下載界面新聞APP

從單核到多核,服務器CPU風云再起

近幾年中,AMD一直緊隨后,窮追不舍,進攻英特爾市場?,F在,服務器CPU領域風云再起。

文|半導體產業(yè)縱橫

隨著云計算的蓬勃發(fā)展,各大IDC數據中心對服務器CPU的要求也是水漲船高。每逢有算力更強、性能更穩(wěn)、成本更低的服務器CPU上市,都會引發(fā)眾多數據中心用戶的高度關注。究其原因其實非常簡單:不論是一個百分點的性能提升,亦或是一個百分點的成本降低,數據中心里那么多臺服務器日積月累下來,也會是一筆非常驚人的數字。

過去20年里,云服務器CPU市場一直被英特爾的x86架構統治,市場份額甚至一度超過90%。近幾年中,AMD一直緊隨后,窮追不舍,進攻英特爾市場?,F在,服務器CPU領域風云再起。

服務器CPU發(fā)展歷史

AMD和英特爾是PC制造領域最具標志性的兩個名字。幾十年來,他們一直在努力為游戲玩家、休閑網絡瀏覽器和專業(yè)人士提供速度最快、功能最強大、功能最豐富的處理器。多年來,他們來來回回幾次激烈競爭。AMD推出了突破性的設計,而英特爾則用自己的革命性芯片做出回應。英特爾在2005年至2015年期間對旗艦性能保持了強有力的把握,AMD真正扭轉了局面推出其Ryzen處理器。

自英特爾在1978年推出第一顆x86處理器8086后,CPU的發(fā)展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。單核性能的提升除了架構以外很重要的一點是取決于頻率和緩存,而頻率限于CPU溫度和功耗不可能增長太快,緩存限于CPU面積和成本同樣不能快速增長,這樣頻率和緩存只能依靠半導體工藝的進步來逐步提升。當CPU的單核效能與頻率都到瓶頸之后,英特爾與AMD都開始向多核發(fā)展。

英特爾從單核到多核之路

2005年5月,英特爾推出史上第一個雙核處理器Pentium D系列,采用90nm工藝核心,每核心擁有1MBL2緩存,均是800MHz的FSB,隨后還推出了帶超線程技術的Pentium Extreme Edition 840處理器,雙核四線程,FSB也提升到了1066MHz,頻率也更高。

之后,Pentium D處理器的繼任者是非常經典的Core 2 Due處理器,而且他們還用當年炮制首款雙核處理器的手法造出了首款四核處理器Core 2 Quad。

2013年英特爾推出的Corei7-980X是首款6核處理器,核心代號Gulftown,它基于Westmere架構,處理器每核心擁有256KB L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。

桌面市場的第一顆真八核處理器是英特爾在2014年推出的Corei7-5960X,屬于22nm的Haswell-E架構,基礎頻率3GHz,最高睿頻3.5GHz,擁有20MBL3緩存,屬于HEDT的X99平臺。

后來,Core i7-6950X成為首款桌面的十核處理器,生產工藝從22nm升級到14nm,核心數量從上代Core i7-5960X的8核增加到10核,晶體管數量也從26億增加到32億。

2017年,英特爾推出了第七代Core X系列處理器,包括Skylake-X與Kabylake-X兩種不同架構的處理器,SkylakeX處理器多了12核、14核、16核、18核的產品,并且用Core i9取代Core i7成為英特爾消費級市場上最強處理器的代名詞。

英特爾的Lakefield項目于2019年正式公開,2020年正式上市,這款產品的實驗性質很重,它是首款采用英特爾Foveros 3D堆疊工藝的產品,也是首款采用混合架構的x86五核處理器。從此英特爾開啟混合架構新時代。

AMD從雙核到96核

AMD的雙核處理器Athlon 64 X2誕生于2005年5月。但與英特爾的PentiumD不同,AMD的Athlon 64 X2是在同一塊芯片內整合了兩個K8核心,兩個核心之間可透過System Request Queue實現數據互通,因此執(zhí)行效率遠高于競爭對手產品。

2007年K10架構的四核于11月11日發(fā)布,它確實是首款原生四核處理器,并且首次把L3緩存引入到消費級市場,但整體效能不如對手的Core 2 Quad。主流平臺的八核處理器,是2017年Zen架構的第一代Ryzen7列處理器,它正式引發(fā)了英特爾與AMD在處理器市場的核心數量大戰(zhàn)。

2018年發(fā)布的第二代銳龍Threadripper,最大核心數量已達到32核。到了銳龍Threadripper 3000,CPU被拆分成CCD計算核心和IOD輸入輸出核心,解決了每個核心之間訪問內存和PCI-E時延遲不一的問題,于是2020年,64核的銳龍Threadriper3990X從此誕生。

最近,在AMD推出的新服務器CPU中,其核心已經提高至96核??偟膩砜?,在高性能計算領域,以盡可能得使用多核心處理器,獲取更高的性能。

服務器CPU比拼激烈

在2022年投資者大會上,英特爾首次披露了2022-2024年的全新英特爾至強產品路線圖。至強Xeon是主要用于"中間范圍"的企業(yè)服務器和工作站。在英特爾的服務器主板上,最多達八個Xeon處理器能夠共用100MHz的總線而進行多路處理。

目前,英特爾最新款服務器CPU仍舊是2021年推出的第三代至強(Xeon)可擴展處理器(代號Ice Lake),其主要亮點包括:采用英特爾最新的10nm工藝,單個芯片最多包含40核。與上一代20核Cascade Lake相比,IPC性能提升20%;在主流數據中心工作負載上性能平均提升46%;74%的AI推理性能增加;與5年前的老系統相比,平均性能提升2.65倍。

來源:英特爾

從路線圖上看,英特爾下一代面向服務器領域CPU代號名為Sapphire Rapids。Sapphire Rapids采用12/13代酷睿同款的Intel7制造工藝,改用新的Socket E LGA4677封裝接口,首次引入chiplet小芯片封裝,物理層面最多60個Golden Cove微架構核心但首批只開啟56個核心,集成112MB三級緩存,熱設計功耗350W。

其他方面,內存支持八通道DDR5-4800,擴展連接提供80條PCIe 5.0/4.0通道,可選集成最多64GB HBM2e內存,還會支持CXL 1.0高速互連總線。

事實上,英特爾希望這款新處理器能憑借對DDR5、PCIe Gen5和Compute Express Link等新技術的率先支持,在市場上全面壓制住AMD的下一代Epyc芯片Genoa。

然而,Sapphire Rapids的面世之路并不順遂。去年6月,英特爾表示將把芯片的量產從2021年第四季度推遲至2022年第一季度,并計劃在第二季度增加出貨量。后來,英特爾又表示推遲計劃,將在今年年底。目前,英特爾最終確定發(fā)表時間為2023年1月。

對此,英特爾高級研究員Ronak Singhal之前做了解釋,他表示對英特爾這樣的公司來說,優(yōu)先考慮的是下一代至強處理器的質量。

AMD和英特爾在服務器CPU上的比拼從未停止。此前就有分析指出,AMD將以高于同行的速度增長,繼續(xù)從競爭對手英特爾手上奪取市場份額,包括個人計算和服務器市場,這一趨勢將在今年和明年持續(xù),預計至少會保持到2024年末。AMD之所以能保持上升趨勢,很大程度得益于EPYC處理器在服務器市場的表現。

與英特爾第三代至強Ice Lake叫陣的是AMD Milan。Milan是7nm,具有64個內核和128個線程,可容納高達4TB的內存容量,并提供128個PCIe通道。Milan在其更新的微架構中打破了羅馬,支持小芯片連接,并導致更多的L3緩存和減少的延遲。相較上一代性能提升19%;峰值功率增加17%。

對于下一代服務器CPU的競爭方面,英特爾宣布了推遲發(fā)布時間,但AMD依舊選擇了在今年11月交出了其Epyc處理器系列的第四個版本,發(fā)布了代號Genoa(熱那亞)的第四代EPYC9004系列處理器,基于Zen4架構,最多96核心192線程,支持12通道DDR5內存、128條PCIe5.0。

根據路線圖,AMD還準備了一個Zen4c版本,產品代號Bergamo(貝加莫),主打多核心與高密度計算,最多128核心256線程、12通道DDR5,使用和Genoa同樣的SP5接口,互相兼容。第四代Epyc使用5nm制造(以及用于內存的小芯片6nm)將900億個晶體管封裝到處理器中。AMD CTO Mark Papermaster近日接受采訪時透露,Bergamo將在明年上半年正式發(fā)布。

可以看到,英特爾的Sapphire Rapid與AMD 128核Bergamo的發(fā)布時間均在明年上半年,這其中火藥味十足。

服務器CPU涌向Arm

對服務器領域的追逐從未停止的,不僅有X86架構,還有Arm陣營。2018年10月,Arm首次宣布推出面向云到邊緣基礎設施產品Neoverse及其初步路線圖,并承諾平臺效能30%的年增長率指標將持續(xù)到2022年及以后。2020年9月,Neoverse再度進階,新增兩個全新的平臺—Neoverse V1平臺以及第二代的N系列平臺Neoverse N2。

ArmNeoverse平臺路線圖

Omdia的數據顯示,二季度Arm已拿下全球7.1%的服務器CPU市場。去年,阿里旗下的平頭哥發(fā)布自研云芯片倚天710,它基于Arm架構,官方稱之為“全球性能領先的云原生處理芯片”,性能超過業(yè)界標桿20%,能效比提升50%以上。

日本RIKEN實驗室的“Fugaku”使用的Arm架構CPU,采用定制的ArmV8架構,依托7納米FinFET制程技術生產。浮點運算部分是與Arm合作開發(fā)的SVE指令擴展,使用512bit浮點運算單元,大幅強化運算能力。

最近,亞馬遜旗下云計算部門AWS宣布推出全新基于Arm架構、自研的高性能計算服務器CPU芯片Graviton 3E。運算性能比上一代多出35%,可組成最多64組虛擬CPU,并具有128GB存儲容量,最快將在2023年初開始布署應用。

AWS高級副總裁彼得·德桑提斯(PeterDeSantis)更表示,這款處理器在某些高性能計算能力上是現有Graviton芯片的兩倍,和其他AWS技術結合時,新芯片的性能還能再提高20%,他更直言,和購買英特爾、英偉達、AMD芯片相比,Graviton3E可以提供性價比更好的算力。

服務器CPU的領域,開始了新一輪的較量。

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

從單核到多核,服務器CPU風云再起

近幾年中,AMD一直緊隨后,窮追不舍,進攻英特爾市場?,F在,服務器CPU領域風云再起。

文|半導體產業(yè)縱橫

隨著云計算的蓬勃發(fā)展,各大IDC數據中心對服務器CPU的要求也是水漲船高。每逢有算力更強、性能更穩(wěn)、成本更低的服務器CPU上市,都會引發(fā)眾多數據中心用戶的高度關注。究其原因其實非常簡單:不論是一個百分點的性能提升,亦或是一個百分點的成本降低,數據中心里那么多臺服務器日積月累下來,也會是一筆非常驚人的數字。

過去20年里,云服務器CPU市場一直被英特爾的x86架構統治,市場份額甚至一度超過90%。近幾年中,AMD一直緊隨后,窮追不舍,進攻英特爾市場?,F在,服務器CPU領域風云再起。

服務器CPU發(fā)展歷史

AMD和英特爾是PC制造領域最具標志性的兩個名字。幾十年來,他們一直在努力為游戲玩家、休閑網絡瀏覽器和專業(yè)人士提供速度最快、功能最強大、功能最豐富的處理器。多年來,他們來來回回幾次激烈競爭。AMD推出了突破性的設計,而英特爾則用自己的革命性芯片做出回應。英特爾在2005年至2015年期間對旗艦性能保持了強有力的把握,AMD真正扭轉了局面推出其Ryzen處理器。

自英特爾在1978年推出第一顆x86處理器8086后,CPU的發(fā)展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。單核性能的提升除了架構以外很重要的一點是取決于頻率和緩存,而頻率限于CPU溫度和功耗不可能增長太快,緩存限于CPU面積和成本同樣不能快速增長,這樣頻率和緩存只能依靠半導體工藝的進步來逐步提升。當CPU的單核效能與頻率都到瓶頸之后,英特爾與AMD都開始向多核發(fā)展。

英特爾從單核到多核之路

2005年5月,英特爾推出史上第一個雙核處理器Pentium D系列,采用90nm工藝核心,每核心擁有1MBL2緩存,均是800MHz的FSB,隨后還推出了帶超線程技術的Pentium Extreme Edition 840處理器,雙核四線程,FSB也提升到了1066MHz,頻率也更高。

之后,Pentium D處理器的繼任者是非常經典的Core 2 Due處理器,而且他們還用當年炮制首款雙核處理器的手法造出了首款四核處理器Core 2 Quad。

2013年英特爾推出的Corei7-980X是首款6核處理器,核心代號Gulftown,它基于Westmere架構,處理器每核心擁有256KB L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。

桌面市場的第一顆真八核處理器是英特爾在2014年推出的Corei7-5960X,屬于22nm的Haswell-E架構,基礎頻率3GHz,最高睿頻3.5GHz,擁有20MBL3緩存,屬于HEDT的X99平臺。

后來,Core i7-6950X成為首款桌面的十核處理器,生產工藝從22nm升級到14nm,核心數量從上代Core i7-5960X的8核增加到10核,晶體管數量也從26億增加到32億。

2017年,英特爾推出了第七代Core X系列處理器,包括Skylake-X與Kabylake-X兩種不同架構的處理器,SkylakeX處理器多了12核、14核、16核、18核的產品,并且用Core i9取代Core i7成為英特爾消費級市場上最強處理器的代名詞。

英特爾的Lakefield項目于2019年正式公開,2020年正式上市,這款產品的實驗性質很重,它是首款采用英特爾Foveros 3D堆疊工藝的產品,也是首款采用混合架構的x86五核處理器。從此英特爾開啟混合架構新時代。

AMD從雙核到96核

AMD的雙核處理器Athlon 64 X2誕生于2005年5月。但與英特爾的PentiumD不同,AMD的Athlon 64 X2是在同一塊芯片內整合了兩個K8核心,兩個核心之間可透過System Request Queue實現數據互通,因此執(zhí)行效率遠高于競爭對手產品。

2007年K10架構的四核于11月11日發(fā)布,它確實是首款原生四核處理器,并且首次把L3緩存引入到消費級市場,但整體效能不如對手的Core 2 Quad。主流平臺的八核處理器,是2017年Zen架構的第一代Ryzen7列處理器,它正式引發(fā)了英特爾與AMD在處理器市場的核心數量大戰(zhàn)。

2018年發(fā)布的第二代銳龍Threadripper,最大核心數量已達到32核。到了銳龍Threadripper 3000,CPU被拆分成CCD計算核心和IOD輸入輸出核心,解決了每個核心之間訪問內存和PCI-E時延遲不一的問題,于是2020年,64核的銳龍Threadriper3990X從此誕生。

最近,在AMD推出的新服務器CPU中,其核心已經提高至96核??偟膩砜?,在高性能計算領域,以盡可能得使用多核心處理器,獲取更高的性能。

服務器CPU比拼激烈

在2022年投資者大會上,英特爾首次披露了2022-2024年的全新英特爾至強產品路線圖。至強Xeon是主要用于"中間范圍"的企業(yè)服務器和工作站。在英特爾的服務器主板上,最多達八個Xeon處理器能夠共用100MHz的總線而進行多路處理。

目前,英特爾最新款服務器CPU仍舊是2021年推出的第三代至強(Xeon)可擴展處理器(代號Ice Lake),其主要亮點包括:采用英特爾最新的10nm工藝,單個芯片最多包含40核。與上一代20核Cascade Lake相比,IPC性能提升20%;在主流數據中心工作負載上性能平均提升46%;74%的AI推理性能增加;與5年前的老系統相比,平均性能提升2.65倍。

來源:英特爾

從路線圖上看,英特爾下一代面向服務器領域CPU代號名為Sapphire Rapids。Sapphire Rapids采用12/13代酷睿同款的Intel7制造工藝,改用新的Socket E LGA4677封裝接口,首次引入chiplet小芯片封裝,物理層面最多60個Golden Cove微架構核心但首批只開啟56個核心,集成112MB三級緩存,熱設計功耗350W。

其他方面,內存支持八通道DDR5-4800,擴展連接提供80條PCIe 5.0/4.0通道,可選集成最多64GB HBM2e內存,還會支持CXL 1.0高速互連總線。

事實上,英特爾希望這款新處理器能憑借對DDR5、PCIe Gen5和Compute Express Link等新技術的率先支持,在市場上全面壓制住AMD的下一代Epyc芯片Genoa。

然而,Sapphire Rapids的面世之路并不順遂。去年6月,英特爾表示將把芯片的量產從2021年第四季度推遲至2022年第一季度,并計劃在第二季度增加出貨量。后來,英特爾又表示推遲計劃,將在今年年底。目前,英特爾最終確定發(fā)表時間為2023年1月。

對此,英特爾高級研究員Ronak Singhal之前做了解釋,他表示對英特爾這樣的公司來說,優(yōu)先考慮的是下一代至強處理器的質量。

AMD和英特爾在服務器CPU上的比拼從未停止。此前就有分析指出,AMD將以高于同行的速度增長,繼續(xù)從競爭對手英特爾手上奪取市場份額,包括個人計算和服務器市場,這一趨勢將在今年和明年持續(xù),預計至少會保持到2024年末。AMD之所以能保持上升趨勢,很大程度得益于EPYC處理器在服務器市場的表現。

與英特爾第三代至強Ice Lake叫陣的是AMD Milan。Milan是7nm,具有64個內核和128個線程,可容納高達4TB的內存容量,并提供128個PCIe通道。Milan在其更新的微架構中打破了羅馬,支持小芯片連接,并導致更多的L3緩存和減少的延遲。相較上一代性能提升19%;峰值功率增加17%。

對于下一代服務器CPU的競爭方面,英特爾宣布了推遲發(fā)布時間,但AMD依舊選擇了在今年11月交出了其Epyc處理器系列的第四個版本,發(fā)布了代號Genoa(熱那亞)的第四代EPYC9004系列處理器,基于Zen4架構,最多96核心192線程,支持12通道DDR5內存、128條PCIe5.0。

根據路線圖,AMD還準備了一個Zen4c版本,產品代號Bergamo(貝加莫),主打多核心與高密度計算,最多128核心256線程、12通道DDR5,使用和Genoa同樣的SP5接口,互相兼容。第四代Epyc使用5nm制造(以及用于內存的小芯片6nm)將900億個晶體管封裝到處理器中。AMD CTO Mark Papermaster近日接受采訪時透露,Bergamo將在明年上半年正式發(fā)布。

可以看到,英特爾的Sapphire Rapid與AMD 128核Bergamo的發(fā)布時間均在明年上半年,這其中火藥味十足。

服務器CPU涌向Arm

對服務器領域的追逐從未停止的,不僅有X86架構,還有Arm陣營。2018年10月,Arm首次宣布推出面向云到邊緣基礎設施產品Neoverse及其初步路線圖,并承諾平臺效能30%的年增長率指標將持續(xù)到2022年及以后。2020年9月,Neoverse再度進階,新增兩個全新的平臺—Neoverse V1平臺以及第二代的N系列平臺Neoverse N2。

ArmNeoverse平臺路線圖

Omdia的數據顯示,二季度Arm已拿下全球7.1%的服務器CPU市場。去年,阿里旗下的平頭哥發(fā)布自研云芯片倚天710,它基于Arm架構,官方稱之為“全球性能領先的云原生處理芯片”,性能超過業(yè)界標桿20%,能效比提升50%以上。

日本RIKEN實驗室的“Fugaku”使用的Arm架構CPU,采用定制的ArmV8架構,依托7納米FinFET制程技術生產。浮點運算部分是與Arm合作開發(fā)的SVE指令擴展,使用512bit浮點運算單元,大幅強化運算能力。

最近,亞馬遜旗下云計算部門AWS宣布推出全新基于Arm架構、自研的高性能計算服務器CPU芯片Graviton 3E。運算性能比上一代多出35%,可組成最多64組虛擬CPU,并具有128GB存儲容量,最快將在2023年初開始布署應用。

AWS高級副總裁彼得·德桑提斯(PeterDeSantis)更表示,這款處理器在某些高性能計算能力上是現有Graviton芯片的兩倍,和其他AWS技術結合時,新芯片的性能還能再提高20%,他更直言,和購買英特爾、英偉達、AMD芯片相比,Graviton3E可以提供性價比更好的算力。

服務器CPU的領域,開始了新一輪的較量。

本文為轉載內容,授權事宜請聯系原著作權人。