編譯|半導體產(chǎn)業(yè)縱橫
GPU租賃是一種經(jīng)濟高效的方式,可以訪問高性能芯片。
隨著 OpenAI 和 Meta 等科技巨頭大量采購圖形處理器(GPU)來驅動人工智能模型,GPU 的獲取難度日益增大。在芯片持續(xù)短缺的形勢下,一批初創(chuàng)公司開始通過出租芯片來增加人們獲得這些備受青睞的人工智能芯片的機會。
GPU 租賃市場是 GPU 即服務這一現(xiàn)有小眾行業(yè)的一部分,芯片所有者借助在線市場,通過云在固定時間段向客戶出售計算能力。通常,公司會選擇亞馬遜網(wǎng)絡服務、微軟 Azure 和 Google Cloud 等主要云服務提供商,它們占據(jù)了全球云計算市場 63% 的份額,在其內(nèi)部部署的數(shù)據(jù)中心運行人工智能工作負載。
然而,GPU 即服務提供了一種更為分散的方式。該領域的提供商與全球的數(shù)據(jù)中心和 GPU 所有者合作,在客戶有需求時將芯片集群出租給他們。新澤西理工學院數(shù)據(jù)科學研究所主任大衛(wèi)?貝德(David Bader)表示,租用計算機能力能讓預算有限的組織,如初創(chuàng)企業(yè)和學術機構,為特定項目獲得高性能的 GPU。
“GPU as a service 極大地平衡了人工智能和高性能計算領域的競爭環(huán)境,” 貝德說,“企業(yè)如今可以按需獲取 GPU 計算能力,無需在快速貶值和易過時的硬件上進行大量前期投資。”
盡管 GPU 的供應鏈限制開始有所緩解,但租賃市場仍在增長。Grand View Research 的數(shù)據(jù)顯示,隨著對高級數(shù)據(jù)分析(如運行機器學習算法)需求的增加,預計到 2030 年,2023 年價值 37.9 億美元的 GPU 即服務市場將以每年 21.5% 的速度增長,達到 122.6 億美元。
生成式 AI 激發(fā)了人們對 GPU 租賃的興趣
自 2022 年 11 月 ChatGPT 問世以來,一些 GPU 租賃領域的初創(chuàng)公司發(fā)現(xiàn)需求急劇上升,因為企業(yè)需要計算能力來構建人工智能。
Vast.ai 創(chuàng)始人兼首席執(zhí)行官杰克?卡內(nèi)爾(Jake Cannell)表示,在生成式人工智能受到熱捧之前,他的公司主要客戶是加密貨幣礦工。如今,在 Vast.ai 的 GPU 租賃服務中,超過一半的項目與人工智能相關??▋?nèi)爾稱,客戶包括人工智能企業(yè)家、初創(chuàng)公司和學者,他們使用 OpenAI 的 GPT 等基礎模型構建自定義大型語言模型,并將大型語言模型(LLM)應用于人工智能圖像生成器 Stable Diffusion 等人工智能相關工作負載。據(jù)卡內(nèi)爾介紹,ChatGPT 的發(fā)布,加上主要云提供商的高需求和 GPU 短缺,促使更多客戶尋找替代方案,這在一定程度上加速了 Vast.ai 的 GPU 租賃需求。這位執(zhí)行官說:“現(xiàn)在產(chǎn)量已經(jīng)跟上,情況可能有所緩解,但需求似乎依舊很高且在不斷增長。”
Vast.ai 成立于 2017 年,它將英偉達和 AMD 的 GPU 集群所有者與尋求租用計算能力的組織聯(lián)系起來。據(jù)卡內(nèi)爾稱,截至 10 月底,市場提供 109 個 GPU 集群,包括英偉達備受歡迎的 H100 芯片,這些集群位于數(shù)據(jù)中心,部分分布在美國、歐洲、亞洲和澳大利亞的數(shù)據(jù)庫中。
Vast.ai 通過提供不同容量、速度和系統(tǒng)要求的 GPU 集群,旨在讓租戶能夠自由選擇特定項目所需的 GPU,并根據(jù)需求靈活地擴展或縮小規(guī)模。例如,開發(fā)人工智能聊天機器人的客戶最初可能租用 100 個 GPU 來訓練模型,后續(xù)可以通過租用數(shù)千個 GPU 來提升計算能力。該公司稱,在產(chǎn)品開發(fā)的不同階段能靈活獲取不同數(shù)量的計算能力,這使得 GPU 租賃比購買芯片更具吸引力。
“只有當對 GPU 存在更可預測且長期穩(wěn)定的需求時,購買才是有意義的,” 卡內(nèi)爾說。
雖然像 Vast.ai 這類在 ChatGPT 發(fā)布前就已成立的初創(chuàng)公司發(fā)現(xiàn)市場對其服務的興趣有所增加,但在聊天機器人發(fā)布后,也有新的初創(chuàng)公司涌現(xiàn),以利用日益增長的 GPU 租賃市場。
Foundry 是一家專為人工智能工作負載打造的 GPU 市場,據(jù)其首席執(zhí)行官賈里德?昆西?戴維斯(Jared Quincy Davis)稱,自 8 月份推出云平臺以來,已經(jīng)吸引了 “數(shù)十家” 客戶,并且能夠通過利用現(xiàn)有芯片的閑置算力大幅降低計算成本。
這家初創(chuàng)公司今年 3 月從紅杉資本和光速創(chuàng)投等投資者那里籌集了 8000 萬美元,通過公司自有的計算集群以及從數(shù)據(jù)中心合作伙伴處獲得的 “未充分利用的集群” 來出租 GPU。
Foundry 的客戶包括技術、電信、媒體和保健行業(yè)的公司,基金會和學術實驗室也在使用其服務。常見的應用場景包括對模型(如 Meta 的 Llama)進行微調以呈現(xiàn)所需特性、從零開始構建神經(jīng)網(wǎng)絡以及執(zhí)行情緒分析(一種用于分析文本情緒傾向的深度學習技術)。Foundry 甚至允許客戶租用 GPU 來預測蛋白質序列用于藥物研發(fā)、訓練模型翻譯稀有語言,以及構建無需人工干預就能控制網(wǎng)站的人工智能代理。
“許多以前只有 OpenAI 和 DeepMind 這類實驗室才能進行的前沿開發(fā),現(xiàn)在其他人也能做到了,因為 Foundry 讓 GPU 計算更易獲取且成本更低,” 戴維斯表示,他曾在 Google DeepMind 擔任工程師。
一些組織已經(jīng)從 GPU 租用中獲益。新澤西理工學院的教授貝德說,他看到自己所在的大學通過 GPU 租賃為研發(fā)等 “關鍵活動” 釋放資源。他認為,GPU 租賃模式非常適合有 “臨時性” 或 “季節(jié)性計算需求” 的項目,并且 “省去了成本高昂的硬件管理和維護負擔”。貝德還表示,他看到小企業(yè)通過與大學合作,獲得了與大企業(yè)相同的 GPU 能力。
“我親眼見證了無數(shù)初創(chuàng)公司從中受益,” 貝德說,“他們不再需要投入數(shù)百萬美元的前期資金來購買專用硬件。相反,他們可以使用租來的 GPU 制作原型、測試和迭代算法,確保資金用于開發(fā)而非基礎設施?!?/p>
長期租用 GPU 可能并不省錢
不過,貝德指出,租用 GPU 與購買 GPU 相比存在一些利弊。
共享基礎設施的性能可能不穩(wěn)定,一旦出現(xiàn)服務中斷,可能會減慢人工智能模型訓練等任務的執(zhí)行速度。盡管前期成本能得到節(jié)省,但租用 GPU 的費用可能會很高。貝德表示,在云和公司之間傳輸數(shù)據(jù)的成本可能會 “快速攀升”,對于需要實時處理的工作負載,不斷遭遇延遲問題的客戶最終可能花費比購買 GPU 更多的費用。對于有嚴格安全和合規(guī)要求的公司來說,缺乏對基礎設施的控制也可能是個 “問題”。
GPU 租賃市場的未來或許還取決于芯片行業(yè)的發(fā)展。畢竟,據(jù)貝德稱,像亞馬遜網(wǎng)絡服務這樣的主要云提供商預計會繼續(xù)拓展業(yè)務范圍,可能會吞并一些小公司,這在短期內(nèi)可能會使價格降低,但從長遠來看會限制消費者的選擇。此外,供應鏈延遲可能會讓云巨頭更難獲得 GPU。
盡管存在這些擔憂,初創(chuàng)公司仍然堅信,隨著人工智能的持續(xù)發(fā)展,未來幾年市場對它們的服務仍有需求。Vast.ai 將繼續(xù)優(yōu)化其 GPU 匹配服務,并更多地直接參與大型語言模型推理等應用場景,特別是針對人工智能代理。Foundry 計劃發(fā)布更多功能,提升平臺的可用性,使其對構建先進模型的人工智能開發(fā)人員更有幫助。
Vast.ai 首席執(zhí)行官卡內(nèi)爾說:“英偉達目前仍是行業(yè)領導者,我認為這種情況不會在短期內(nèi)改變,但競爭愈發(fā)激烈了?!?/p>
原文:observer