界面新聞記者 | 蔡木子
界面新聞編輯 | 鄭萃穎
建立更復雜的環(huán)境和氣候模型可以幫助人們理解氣候變化的機理,利用先進的模型去優(yōu)化整合低碳能源系統(tǒng),用算法去判定天氣和農(nóng)作物的長勢從而服務精準農(nóng)業(yè)……在由OpenAI帶領的這一波人工智能熱潮中,AI能給社會經(jīng)濟帶來可持續(xù)發(fā)展的助力。AI的應用因此被放在聚光燈下,引發(fā)許多未來的美好期待。
少有人知的是,在人工智能技術的基礎研究和產(chǎn)品設計過程中,需要耗費大量的水電等自然資源,產(chǎn)生非常高的碳足跡和水足跡。就像AI給人類社會帶來效率提升的同時也帶來治理和道德危機一樣,在環(huán)境影響和可持續(xù)發(fā)展命題上,AI亦是一把“雙刃劍”。
“在微軟最先進的美國數(shù)據(jù)中心訓練 GPT-3 ,可直接蒸發(fā)70萬升清潔淡水,但這些信息一直被保密,這一點非常令人擔憂?!奔又荽髮W河濱分校電氣與計算機工程系副教授任紹磊(Shaolei Ren)在接受界面新聞專訪時說。任紹磊的研究主要聚焦于“人工智能+可持續(xù)性”,致力于使人工智能和計算技術帶領我們的社會走向更加可持續(xù)和公平的路徑。他尤其聚焦人工智能的用水問題,并早在2013年起就開始研究。
任紹磊介紹,人工智能(AI)模型,尤其是像 GPT-3、GPT-4 這樣的大型模型,其碳足跡越來越大,這點一直受到公眾關注。但人工智能模型同樣重要而巨大的水足跡仍未引起足夠重視。目前,淡水匱乏已成為全球共同面臨的最緊迫挑戰(zhàn)之一。到2027年,全球人工智能需求可能會產(chǎn)生42-66億立方米的取水量,這相當于丹麥每年取水總量的4-6倍。
如何提高AI大廠在能耗方面的信息披露透明度、如何通過合理的數(shù)據(jù)中心地理布局來降低能耗?更重要的,如何將可持續(xù)的理念植入AI開發(fā)設計階段,從而避免這個革命性行業(yè)重蹈老工業(yè)化時代“先污染再治理”覆轍?任紹磊透過對微軟和谷歌的案例分析試圖提供一些解決方案。對于同樣在人工智能領域迅猛布局的中國來說,也有啟發(fā)意義。
GPT-3一次對話至少要“喝”10毫升水
界面新聞:我讀過您的一篇研究,是關于GPT-3耗水量的,印象深刻。能跟我們詳細介紹一下這個研究么?
任紹磊:我在2013年就做過數(shù)據(jù)中心耗水的研究,但當時這個研究離普通人的生活太遠了,沒有得到很多關注。由于AI行業(yè)發(fā)展迅猛,很多學者近幾年開始關注AI的碳足跡,但是關注水足跡的人很少。我就想,是不是可以做AI水資源消耗的文章?根據(jù)我之前的研究基礎,AI在水資源方面的消耗應該是非常巨大的。
AI的發(fā)展都基于大規(guī)模的數(shù)據(jù)中心,而數(shù)據(jù)中心耗電量巨大,95%以上的電能會轉(zhuǎn)化成熱能。降熱降溫需要消耗大量的水。現(xiàn)在主要有兩種方式降溫:一種是利用水蒸發(fā)帶走熱量,也就是利用冷卻塔,這個過程需要消耗大量的水;還有一種是直接用空氣流動散熱,通俗地說就是“用風吹”,但在天氣熱的時候需要用水預涼,天氣干燥的時候需要用水加濕。
在微軟全球數(shù)據(jù)中心,平均來算大概每用一度電就要蒸發(fā)掉一升水。而這一度電大概能支撐數(shù)據(jù)中心一臺服務器工作20分鐘到一個小時。這一升水還只是數(shù)據(jù)中心直接用水。為了產(chǎn)生這一度電,在發(fā)電環(huán)節(jié)還要消耗大量的水。按照業(yè)界平均水平,每發(fā)一度電要消耗大約3-6升水。
根據(jù)微軟公布的官方數(shù)據(jù),GPT-3每產(chǎn)生100頁的對話內(nèi)容,要消耗0.4千瓦時的電。經(jīng)過我們的計算,GPT-3每進行10-50次的基本詢問對話,就需要消耗500毫升的水。也就是說,每一次詢問對話,它至少要“喝”10毫升以上的水。在微軟最先進的美國數(shù)據(jù)中心訓練GPT-3可直接消耗70萬升清潔淡水,足夠生產(chǎn) 370輛寶馬汽車或370輛奔馳汽車。而且,這些水不是“取水”,而是消耗掉并不可再生的。
界面新聞:現(xiàn)在數(shù)據(jù)中心耗水量的差別,主要是溫度引起的么?
任紹磊:是的,溫度和冷卻方式會對耗水量有較大影響。比如說,微軟宣布GPT-4是在美國愛荷華州進行數(shù)據(jù)訓練的,那里平均氣溫比較低。根據(jù)我們的研究,如果是在天氣較熱的美國亞利桑那州訓練,耗水量將是愛荷華的11倍。
溫度的影響不難理解,相對較低溫有利于散熱。在冷卻方式方面,在氣溫適宜的地方,可以采用直接引入室外冷空氣降溫的辦法,不用冷卻塔水蒸發(fā)帶走熱量,也不需要預先冷卻空氣,就減少了大部分耗水。
界面新聞:因此,AI要減少耗水,可以在數(shù)據(jù)中心的地點選擇上做文章?
任紹磊:對,我們在研究中就提出了建議,由于人工智能的工作是通過互聯(lián)網(wǎng)進行的,因此可以很簡單地采取諸如交換任務發(fā)送等方式,更加靈活地使用數(shù)據(jù)中心。將計算請求轉(zhuǎn)移到由清潔能源供電的數(shù)據(jù)中心,或者轉(zhuǎn)移到用水量較少的較冷地區(qū)的數(shù)據(jù)中心,這是一種對氣候有利的變化。而從用戶體驗的角度來看,也沒有太大影響。
如何兼顧效率與公平?呼吁大廠提高能源消耗信息透明度
界面新聞:您的另一項研究探討了人工智能模型的加速增長可能加劇環(huán)境不平等,能跟我們介紹一下這項研究么?
任紹磊:總的來說,人工智能的環(huán)境足跡在某些地區(qū)比其他地區(qū)高得多。這是因為在實際建設數(shù)據(jù)中心或相關大型基礎設施時,公司大多選擇相對偏遠的地區(qū)。比如在美國,很多數(shù)據(jù)中心的選址都是經(jīng)濟相對沒那么發(fā)達,人口沒那么稠密的地區(qū)。反過來說,如果是在經(jīng)濟實力比較強的社區(qū),數(shù)據(jù)中心往往會因為噪音、空氣、水熱污染等問題招來強烈的民意反彈,導致建設計劃流產(chǎn)。
因此,這就導致了一個惡性循環(huán)。越是欠發(fā)達社區(qū),越有可能建設那些帶來負面環(huán)境影響的AI基礎設施,從而進一步惡化當?shù)氐沫h(huán)境,加劇環(huán)境不平等。
界面新聞:但是如我們之前討論的,從減少能耗角度看,數(shù)據(jù)中心也適宜建設在溫度比較低、地廣人稀的地方。如果這些地方恰好是比較薄弱的社區(qū),我們怎么去平衡效率和公平的問題?
任紹磊:是的,有時候很難兩全,需要去平衡。我們需要注意,環(huán)境要素不是免費的,“涼快”不是免費的。因為發(fā)電和數(shù)據(jù)中心運行還無法做到100%清潔能源供電,怎么衡量環(huán)境要素投入的經(jīng)濟價值?怎么為負面環(huán)境影響,對當?shù)鼐用褡龀錾鷳B(tài)補償?這些都是我們應該思考的問題。比如說在美國,微軟在很多地區(qū)會建設數(shù)據(jù)中心配套的污水處理廠或風力發(fā)電廠,這就是對當?shù)丨h(huán)境的一種補償。
我注意到許多美國科技公司已經(jīng)非常關注環(huán)境公平問題,有時候甚至把公平放在效率和成本之前。比如Meta(Facebook)在自己的ESG報告里,就是把環(huán)境公平放在首要考慮位置,它的能源消耗的信息披露也是最全面的。微軟計劃在印度建設的數(shù)據(jù)中心,甚至已經(jīng)宣布不直接用水冷卻,而改用利用空氣冷卻的冷凝器,這可能是考慮到印度缺水又很熱。用冷凝器降溫可以避免在當?shù)刂苯雍乃?,但卻大大增加了制冷能耗,導致發(fā)電環(huán)節(jié)用水大幅上升,因此總體用水量是否減少還不好判斷。總之,在社會輿論壓力下,許多大廠都不得不更多地去考慮社會環(huán)境效益。
界面新聞:您的文章點名了一些大廠,所以產(chǎn)生了比較大的影響力。您的研究中還提到谷歌在2022年,僅自有數(shù)據(jù)中心就消耗近200億升水用于現(xiàn)場冷卻,其中大部分是飲用水,總體用水量較2021年增加約20%。您的研究都是基于公開數(shù)據(jù)么?研究發(fā)表后,這些大廠跟您聯(lián)系過么?
任紹磊:微軟沒有聯(lián)系過我,但是在相關媒體報道出來之后,微軟有進一步公布更詳細的提高水資源利用效率的方式。谷歌有間接聯(lián)系過我們大學,對研究所用的數(shù)據(jù)提出了一些質(zhì)疑,但又拒絕提供自己更詳細的數(shù)據(jù)。我們最終版論文的所有數(shù)據(jù)均來自官方數(shù)據(jù)、政府數(shù)據(jù)或者業(yè)界知名的研究機構(gòu)數(shù)據(jù),去掉了所有我們自己根據(jù)模型推算的數(shù)據(jù)。
界面新聞:有意思。對于這些大廠的能源消耗信息披露,您是否覺得足夠透明呢?
任紹磊:還有提升空間。比如說微軟披露了自己每個數(shù)據(jù)中心的用水效率,沒有披露相應的用水量和用電量;谷歌披露了每個數(shù)據(jù)中心的用水量,又沒有披露用水效率。有一種解釋是,如果用水用電量和效率都披露了,就能算出它的實際用水用電量,從而得出企業(yè)部署在當?shù)氐臉I(yè)務量。但這也不是什么商業(yè)機密,Meta就詳細公布了每個業(yè)務地點的用電量、用水量,有的地方甚至包括了發(fā)電環(huán)節(jié)的用水量。
只有更充分的信息披露,才能給公眾知情權(quán),也會給公司帶來更多的改進壓力。從這方面看,高科技大廠特別是耗能較大的AI大廠應該提高能耗披露透明度。
在軟件開發(fā)階段引入可持續(xù)理念,才能“治本”
界面新聞:除了數(shù)據(jù)中心所在地溫度和冷卻方式會影響耗水量外,還有什么方法能改進AI產(chǎn)業(yè)發(fā)展的可持續(xù)性呢?
任紹磊:另一個方法其實就是少用點兒能耗,也就是不用那么大的計算模型,用小一些的模型去構(gòu)建你的AI產(chǎn)品,用水用電自然會降低。其實在GPT的訓練過程中,微軟也會使用大小不一樣的模型去模擬,小模型就是大模型壓縮出來的,去掉了一些不太重要的參數(shù),它也能回答絕大多數(shù)基本問題。甚至小模型的響應速度更快,也就是回答問題更快,因為它更靈活,計算量更小了。這就好比消費者買車,奔馳車和QQ車其實都能滿足基本需求,那也不一定任何消費者都需要去買奔馳。
界面新聞:但是AI現(xiàn)在的發(fā)展階段,仿佛是各個大廠在搞算力上的“軍備競賽”,追求更大、更強、更智能,基于實際需求的、可持續(xù)發(fā)展的理念似乎還很少在產(chǎn)品開發(fā)階段被關注到。
任紹磊:對,這就是我想說的問題。AI發(fā)展要可持續(xù),怎樣才是“治本”之道?現(xiàn)在大廠在數(shù)據(jù)中心選址上做文章,在大樓建設上做文章,其實都是治標不治本。特別是考慮到AI的本質(zhì),就是“更聰明”、使用更少資源去做事。這些大廠其實在可持續(xù)開發(fā)方面,根本沒有用到自己的專長。在軟件開發(fā)階段,碼農(nóng)們不會考慮能耗問題,而是怎么高大上怎么來;程序?qū)懗鰜砹?,先上線跑再說,先能賺到錢再說。至于需要多少電、需要多少水,那就讓公司去買;負面環(huán)境影響大了,公司再去想怎么抵消環(huán)境影響。
前幾天我剛?cè)ラ_了一個會議,大家非常關注一個理念,叫做Software Sustainability by Design,也就是具有可持續(xù)性的軟件設計,美國已經(jīng)有一些協(xié)會和組織在推行這個理念。很多人已經(jīng)注意到,不計環(huán)境成本的軟件開發(fā)帶來了很多能源資源浪費和不可逆的環(huán)境影響。這就好比第一步走錯了,樓建歪了,你是可以再修補,但修補成本就會很高。而如果在軟件設計階段就考慮到節(jié)能,綜合成本會低得多。
界面新聞:您說的這個太重要了,也很有啟發(fā)性。因為大家直覺上會覺得軟件開發(fā)不是一個重自然資源消耗的行業(yè),也就容易忽視全產(chǎn)業(yè)鏈的環(huán)境負面影響,忽視了把可持續(xù)理念前移到開發(fā)階段的重要性。您跟一些“碼農(nóng)”聊過么?他們怎么看Software Sustainability by Design?
任紹磊:其實很難要求一些傳統(tǒng)的“碼農(nóng)”去注意節(jié)能問題,因為從他們的學習、訓練來看,都不會接觸到能源的議題。這需要企業(yè)從頂層設計上,引入一些專業(yè)人士,去平衡各方面的因素,也是一個比較復雜的決策過程,涉及到從ESG角度去做公司治理和生產(chǎn)流程的改變。
我觀察到微軟已經(jīng)引入了一些這方面的外部專家,比如說前羅格斯大學的教授Ricardo Bianchini,以前我們一起做可持續(xù)計算方面的研究,現(xiàn)在在微軟負責數(shù)據(jù)中心能耗及綠色計算;去年底,微軟還挖來了前白宮總統(tǒng)能源助理Melanie Nakagawa任首席可持續(xù)發(fā)展官,她在微軟的主要工作之一就是負責水資源優(yōu)化。
界面新聞:您關注過中國的AI公司在可持續(xù)發(fā)展方面的情況么?有沒有什么建議?
任紹磊:中國的AI產(chǎn)業(yè)發(fā)展當然也是非??斓模瑪?shù)據(jù)中心的產(chǎn)業(yè)規(guī)模也非常大。國內(nèi)很多數(shù)據(jù)中心的建設也已經(jīng)考慮了環(huán)境因素,比如貴州、內(nèi)蒙的數(shù)據(jù)中心比較多,這也在一定程度上減少了能耗。但與此同時,國內(nèi)還有很多大廠委托的第三方數(shù)據(jù)中心,也有相當一部分分布在長三角、京津冀等地區(qū)。
在AI分配計算任務時,也可以考慮更為靈活地在各個地方的數(shù)據(jù)中心轉(zhuǎn)換。以前可能更多考慮速度問題,比如北京的用戶要看一個視頻,那當然調(diào)用北京的數(shù)據(jù)中心最快;但現(xiàn)在的網(wǎng)絡延時已經(jīng)非常小了,考慮到能耗問題,是不是也可以調(diào)用內(nèi)蒙的數(shù)據(jù)中心?這個時間差用戶是感受不到的,但是綜合起來對服務器的負載有很大影響。尤其是對AI的訓練,這個太靈活了,全國各地數(shù)據(jù)中心轉(zhuǎn)一圈兒都可以,要充分考慮環(huán)境成本來考慮選址。