記者 | 佘曉晨
作為“東數(shù)西算”的代表性城市之一,烏蘭察布又多了小鵬汽車這位“新朋友”。
近日,小鵬汽車宣布在內(nèi)蒙古烏蘭察布建成中國最大的自動駕駛智算中心“扶搖”,用于自動駕駛模型訓(xùn)練。
“智算”指的是智能計(jì)算,是一種專用于機(jī)器學(xué)習(xí)的算力形式。據(jù)工信部統(tǒng)計(jì),目前中國已有20多座智算中心,包括谷歌、微軟、Meta、特斯拉、阿里在內(nèi)的科技公司都已建造智算中心。而對于自動駕駛行業(yè)來說,數(shù)據(jù)訓(xùn)練至關(guān)重要,算力的挑戰(zhàn)也在加劇。
成本和效率或是此次合作中強(qiáng)調(diào)的關(guān)鍵詞。
小鵬汽車董事長、CEO何小鵬向媒體表示,隨著自動駕駛模擬訓(xùn)練的需求變化,他們需要一個強(qiáng)大的本地+云端的算力以支持訓(xùn)練?!叭ツ瓿跷覀兙团袛?,2025年之后小鵬的算力每年花費(fèi)可能會超過10個億,因此要思考如何把算力不斷提高,控制好成本,把技術(shù)鋪墊做好?!焙涡※i說。
據(jù)小鵬汽車方面介紹,“扶搖”對GPU資源進(jìn)行細(xì)粒度切分、調(diào)度,將GPU資源虛擬化利用率提高3倍,支持更多人同時在線開發(fā),效率提升十倍以上。此外,“扶搖”采用風(fēng)冷、AI調(diào)溫、模塊化設(shè)計(jì)等綠色技術(shù),年平均PUE(數(shù)據(jù)中心能耗電力電源使用效率)低于1.2——目前國內(nèi)企業(yè)數(shù)據(jù)中心的PUE平均值為1.5左右。
之所以實(shí)現(xiàn)上述效果,不得不提到烏蘭察布的地理和氣候優(yōu)勢。
烏蘭察布的冷涼氣候可以極大地降低制冷消耗的電力,而這部分電力在大數(shù)據(jù)中心服務(wù)器電力消耗中占據(jù)較大比重,多達(dá)40%。同時,烏蘭察布市數(shù)據(jù)中心可享受0.26元/度的電價,幾乎是全國最優(yōu)惠。除了阿里巴巴,蘋果、華為、騰訊等12大數(shù)據(jù)中心都已落戶烏蘭察布。
從最直觀的效果來看,“扶搖”建成后,自動駕駛模型訓(xùn)練的速度將大幅提升。以小鵬的一個核心模型為例,過去需要7天才能完成一次訓(xùn)練,但算力規(guī)模達(dá)600PFLOPS(每秒浮點(diǎn)運(yùn)算60億億次)的“扶搖”可讓訓(xùn)練時間縮短至不到1小時,提速了近170倍。據(jù)了解,目前“扶搖”正用于小鵬城市NGP輔助駕駛系統(tǒng)的算法模型訓(xùn)練。
盡管阿里云此前已在烏蘭察布建立數(shù)據(jù)中心,但此次和小鵬汽車合建的“扶搖”采用公有云專屬集群模式,是兩家公司在汽車領(lǐng)域的首次應(yīng)用嘗試。
阿里云智能解決方案銷售部總經(jīng)理霍嘉稱,之所以選擇這樣的模式,一方面是出于小鵬汽車對算力的優(yōu)化要求,另一方面也是為了保留未來利用云計(jì)算大基礎(chǔ)設(shè)施的彈性。
何小鵬則表示,小鵬汽車在“扶搖”中建立了三套數(shù)據(jù)閉環(huán),跟原來的純算力平臺相比,智算中心的耦合更深。并且,除了算力、電力、存儲力這些平臺上的技術(shù),雙方還在軟件層面進(jìn)行更多合作。
霍嘉透露稱,阿里云和小鵬汽車的確是基于計(jì)算存儲網(wǎng)絡(luò)開始合作,但從去年下半年開始,他們已經(jīng)在人工智能平臺、數(shù)字工廠等領(lǐng)域推進(jìn)合作;“扶搖”項(xiàng)目也是從2021年開始推進(jìn)。
今年2月17日,國家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)通知,同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動建設(shè)國家算力樞紐節(jié)點(diǎn),并規(guī)劃了10個國家數(shù)據(jù)中心集群。乘著“東數(shù)西算”的東風(fēng),云計(jì)算公司將更多目光投注到西部地區(qū)。
阿里云從2020年就開始和烏蘭察布合作,計(jì)劃在當(dāng)?shù)赝顿Y100個億。在和小鵬汽車合作之后,阿里云打造行業(yè)標(biāo)桿案例的意圖也很明顯。但在建成基礎(chǔ)設(shè)施之后,數(shù)據(jù)中心的上架率和使用率將是影響后續(xù)發(fā)展的重要因素。如何吸引更多企業(yè)和行業(yè)進(jìn)行“西算”,為他們提供合適的云服務(wù)方案,是頭部云計(jì)算公司共同面臨的挑戰(zhàn)。