文|IT時報記者 范昕茹
編輯|王昕 孫妍
3月23日,在英偉達的GTC大會上,英偉達CEO黃仁勛借由ChatGPT的成功向世界展示了一個無限寬廣的AI未來圖景。在這個宏大場景之下,AI不再是虛幻不可見的東西。它在芯片生產(chǎn)、醫(yī)療、文化創(chuàng)作等各個領域發(fā)揮著巨大的作用,給世界帶來天翻地覆的變化。
AI終于從幻影中走出,迎來了清晰的商業(yè)化之路,黃仁勛將之稱為“AI的iPhone時刻”。
2022年,在新一代顯卡的發(fā)布會上,黃仁勛直言“摩爾定律已死”,往后的芯片性能不會再遵循這個定律。而借由“AI的iPhone時刻來臨”的口號,黃仁勛向世界宣告了“黃仁勛定律”的到來。
“黃仁勛定律”誕生
CuLitho計算光刻技術軟件庫是英偉達與全球最大晶圓代工廠臺積電、全球最大光刻機巨頭阿斯麥、全球最大EDA巨頭新思科技合作,秘密研發(fā)近四年的“核彈”。
根據(jù)黃仁勛的表述,CuLitho在GPU上運行時,可以將計算光刻加速40倍以上,為2nm及更先進的工藝奠定基礎。他舉例,NVIDIA H100生產(chǎn)需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要4萬個CPU系統(tǒng)才能完成工作,如果在GPU上運行CuLitho,這個過程只需要8小時。與此同時,CuLitho還能助力降低耗電以及對環(huán)境的影響,將功率從35MW降至5MW。
在短期內(nèi),使用CuLitho的晶圓廠每天的光掩模產(chǎn)量可增加3~5倍,而耗電量可以比當前配置降低9倍。原本需要兩周時間才能完成的光掩?,F(xiàn)在可以在一夜之間完成。
隨著光刻技術臨近物理極限,這項技術通過加速計算光刻流程,將有助于晶圓廠縮短原型周期時間、提高產(chǎn)量、減少碳排放,為2nm及更先進的工藝奠定基礎,并使得曲線掩模、high NA EUV、亞原子級光刻膠模型等新技術節(jié)點所需的新型解決方案和創(chuàng)新技術成為可能。
對英偉達而言,CuLitho展示了英偉達進入芯片制造生產(chǎn)銷售全鏈路的野心。黃仁勛定律的核心在于利用GPU芯片算力大幅度提升芯片制造效率,以此來加速摩爾定律削減帶來的生產(chǎn)瓶頸。
對英偉達而言,當它同時介入芯片的生產(chǎn)和銷售環(huán)節(jié),成為其中的一部分,CuLitho將給芯片產(chǎn)業(yè)帶來巨大的變化:AI芯片的生產(chǎn)環(huán)節(jié)本身也成為AI芯片消費的一部分。GPU芯片將成為芯片行業(yè)主要的流通貨幣。
當然,這一切發(fā)生的前提是“AI的iPhone時刻”真的已經(jīng)到來。
算力卡了大模型脖子
在GTC大會上,黃仁勛對軟硬件市場空間做過一個回應。在他看來,人工智能軟件是一個比硬件大得多的市場,而硬件的銷售機會主要來自基礎設施服務市場。也就是說,GPU芯片的市場多大,取決于AI軟件的商用程度。
如今,AI大模型公司不得不面臨的一個主要困境——算力。每一個AI大模型背后,都需要巨量算力的支撐。為了支撐OpenAI訓練出ChatGPT,微軟專門為OpenAI打造了一臺由數(shù)萬個A100 GPU組成的AI超級計算機。TrendForce研究推測,以A100的算力為基礎,GPT-3.5大模型需要高達2萬枚GPU,未來商業(yè)化后可能需要超過3萬枚。
集之互動CEO陸文斌告訴《IT時報》記者,1年半前,其所在公司采購了50多塊A100芯片,用于高精度數(shù)字人的研發(fā)。在數(shù)字孿生的應用場景中,一位醫(yī)生可以只需錄制20分鐘左右的視頻,便可以“孿生”為一個數(shù)字人。之后,只要輸入相應的數(shù)據(jù),便可以由“孿生人”自己演講、互動或者授課,期間,無論是文字轉(zhuǎn)換為語音,還是互動式的NLP(自然語言處理),亦或是數(shù)字人逼真的面部擬人化,每個環(huán)節(jié)都需要消耗巨量的算力,“精度越高,需要投入的算力越多,需要的資金也越多”。
陸文斌以最簡單的“數(shù)字人說話”場景舉例,通常而言,人類的唇部大約有近千個神經(jīng)元,這些神經(jīng)元相互連接作用,當人開口講話時,每個字形成的唇形都不相同。他們公司制作的數(shù)字人,在其唇部部署了300個神經(jīng)元,這在國內(nèi)已經(jīng)是相當高水平的精度,但要想做得更逼真,唯有投入更多的算力渲染。
這還只是在研發(fā)端的算力消耗,商用化的道路上,終端成了落地的絆腳石。在強大算力的支撐下,高精度數(shù)字人可以進行流暢的表情演示,但目前市面上高性能的筆記本電腦卻難以支撐超高模數(shù)字人的流暢演示,更不用說手機。
更讓陸文斌擔心的是,此前購置第一批英偉達A100芯片時,限售令還沒頒布。第二批入手在限令之后,價錢已上漲了50%。從公司的業(yè)務發(fā)展速度來看,加上芯片損耗,他擔心,可能2~3年后便買不起芯片了,也無更多算力可用。
但ChatGPT的成功,正吸引一批企業(yè)投身AI大模型市場。百度的“文心一言”已經(jīng)上線;騰訊總裁劉熾平表示會持續(xù)優(yōu)化混元AI大模型;字節(jié)跳動則傳出了前達摩院大模型M6帶頭人入職,并參與語言生成大模型研發(fā)的消息。創(chuàng)新工場CEO李開復、前搜狗CEO王小川、原美團聯(lián)合創(chuàng)始人王慧文、前京東AI掌門人周伯文、出門問問創(chuàng)始人李志飛、阿里技術副總裁賈揚清,這些聲名赫赫的業(yè)界大佬,都紛紛入局大模型市場。
當大廠入局,企業(yè)對算力的爭奪將更加激烈。而目前在AI芯片領域,英偉達舉著望遠鏡也看不到敵人。對國內(nèi)企業(yè)來說,如果一直無法找到合適的替代方案,未來算力從何而來?
最近,陸文斌的數(shù)字人公司正在與國內(nèi)GPGPU芯片廠商合作調(diào)試,以便當更大的“黑天鵝”來臨時,可以提前防范部分風險,“我們也在提前做一些研發(fā)布局,包括是否可以在低配置的硬件設備上,利用軟件跑出更好的效果。也很希望能和更多國內(nèi)芯片、智能硬件廠商合作,盡量降低算力‘卡脖子’對國產(chǎn)人工智能產(chǎn)業(yè)的影響”。
算力跨境,數(shù)據(jù)落地
針對中小企業(yè)算力缺失的問題,英偉達也給出了自己的答案——DGX Cloud算力平臺。DGX Cloud背后是DGX(AI超級計算機)的算力能力。通過這個平臺,企業(yè)無須購買硬件,可以通過網(wǎng)頁瀏覽的方式獲取高性能算力,享受到和Open AI同樣的算力引擎,擴展多節(jié)點AI訓練。企業(yè)可以通過月租的方式獲取算力,每月租金36999美元??梢哉f,DGX Cloud云平臺降低了用戶使用算力的門檻。
然而,跨過了使用門檻,即便云能力可以跨境,但數(shù)據(jù)不行。隨著各個國家對數(shù)據(jù)管控的加強,跨境數(shù)據(jù)傳輸也成為云平臺跨境運營的壁壘。美國《國家安全戰(zhàn)略報告》將數(shù)據(jù)安全作為維護國家安全的核心戰(zhàn)略要素,強調(diào)要保持美國在網(wǎng)絡空間和數(shù)據(jù)資源上的優(yōu)勢。歐盟的《數(shù)字化單一市場戰(zhàn)略》中也指出,歐盟將采取“內(nèi)松外緊”的數(shù)據(jù)跨境流動管理思路。2022年9月1日,我國《數(shù)據(jù)出境安全評估辦法》正式施行,對涉及個人信息的跨境數(shù)據(jù)傳輸進行管控。
互聯(lián)網(wǎng)企業(yè)跨境運營面臨的數(shù)據(jù)安全壓力也日漸凸顯。在數(shù)據(jù)安全的壓力下,蘋果將數(shù)據(jù)中心交由“云上貴州”托管,將國內(nèi)數(shù)據(jù)存放在我國本土。字節(jié)跳動旗下的TikTok則不斷面臨著來自美國的政策壓力。3月23日,字節(jié)跳動海外短視頻平臺TikTok CEO周受資參加主題為“TikTok:國會如何保護美國數(shù)據(jù)隱私,保護兒童免受網(wǎng)絡傷害”的美國眾議院能源與商務委員會聽證會。
這意味著,DGX Cloud想要商用,勢必要將數(shù)據(jù)中心本土化。目前,英偉達對此采取的策略是與云廠商合作,采用托管的形式進行。黃仁勛表示,未來中國也可以采用這項服務,中國創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務,但在算力需求急速增長的現(xiàn)在,服務得以開展的時間和定價都還很難判斷。
作為軟件端的ChatGPT其實也面臨著同樣的數(shù)據(jù)風險。即便如今ChatGPT被接入微軟Office全家桶,其能力也讓C端用戶大為震驚,但對企業(yè)用戶而言,由于其生產(chǎn)力的獲取需要通過數(shù)據(jù)的投喂進行,騰訊、阿里等企業(yè)已經(jīng)明令禁止員工向其投喂數(shù)據(jù),ChatGPT的商業(yè)化之路仍模糊難辨。
人工智能面臨政策拷問
除開數(shù)據(jù)帶來的安全隱患,“AI的iPhone時刻”還將因相關政策監(jiān)管而推遲到來。
自人工智能誕生以來,治理問題就一直是全球監(jiān)管機構關注的熱點。歐盟正著手準備創(chuàng)建一個新的監(jiān)管部門來負責AI的治理,以應對ChatGPT這類人工智能可能帶來的挑戰(zhàn)。
英國正在計劃如何分配監(jiān)管機構管理人工智能的職責。英國政府3月29日發(fā)布了一項計劃,將不會專門成立一個負責人工智能技術監(jiān)管的部門,并將避免可能扼殺創(chuàng)新的嚴厲立法,而是會根據(jù)安全、透明、公平和問責制等廣泛原則采取適應性強的監(jiān)管方法。而國內(nèi)針對ChatGPT這類人工智能治理相關的討論也在業(yè)內(nèi)不斷增加。
不僅如此,人工智能大模型帶來的風險已經(jīng)引發(fā)了多位科技領袖的深切擔憂。近日,OpenAI的共同發(fā)起人伊隆·馬斯克和一群人工智能專家及行業(yè)高管在一封最新發(fā)布的公開信中呼吁,在未來六個月暫停對GPT模型的訓練,以免該模型變得更加強大,從而對社會和人類造成潛在風險。這封公開信如今已經(jīng)獲得1000多人署名,呼吁在GPT進一步強大之前,需要首先就此類大模型達成由獨立專家開發(fā)、實施并審核的共享安全協(xié)議。
當英偉達用“黃仁勛定律”迎接一個屬于GPU的時代來臨時,“AI的iPhone時刻”或許將首先面臨政策、數(shù)據(jù)、安全的拷問,而唯有邁過這些門檻,“AI的iPhone時刻”或才終將來臨。
排版/ 季嘉穎
圖片/ 英偉達
來源/《IT時報》公眾號vittimes