編譯|半導(dǎo)體產(chǎn)業(yè)縱橫
GPU租賃是一種經(jīng)濟(jì)高效的方式,可以訪(fǎng)問(wèn)高性能芯片。
隨著 OpenAI 和 Meta 等科技巨頭大量采購(gòu)圖形處理器(GPU)來(lái)驅(qū)動(dòng)人工智能模型,GPU 的獲取難度日益增大。在芯片持續(xù)短缺的形勢(shì)下,一批初創(chuàng)公司開(kāi)始通過(guò)出租芯片來(lái)增加人們獲得這些備受青睞的人工智能芯片的機(jī)會(huì)。
GPU 租賃市場(chǎng)是 GPU 即服務(wù)這一現(xiàn)有小眾行業(yè)的一部分,芯片所有者借助在線(xiàn)市場(chǎng),通過(guò)云在固定時(shí)間段向客戶(hù)出售計(jì)算能力。通常,公司會(huì)選擇亞馬遜網(wǎng)絡(luò)服務(wù)、微軟 Azure 和 Google Cloud 等主要云服務(wù)提供商,它們占據(jù)了全球云計(jì)算市場(chǎng) 63% 的份額,在其內(nèi)部部署的數(shù)據(jù)中心運(yùn)行人工智能工作負(fù)載。
然而,GPU 即服務(wù)提供了一種更為分散的方式。該領(lǐng)域的提供商與全球的數(shù)據(jù)中心和 GPU 所有者合作,在客戶(hù)有需求時(shí)將芯片集群出租給他們。新澤西理工學(xué)院數(shù)據(jù)科學(xué)研究所主任大衛(wèi)?貝德(David Bader)表示,租用計(jì)算機(jī)能力能讓預(yù)算有限的組織,如初創(chuàng)企業(yè)和學(xué)術(shù)機(jī)構(gòu),為特定項(xiàng)目獲得高性能的 GPU。
“GPU as a service 極大地平衡了人工智能和高性能計(jì)算領(lǐng)域的競(jìng)爭(zhēng)環(huán)境,” 貝德說(shuō),“企業(yè)如今可以按需獲取 GPU 計(jì)算能力,無(wú)需在快速貶值和易過(guò)時(shí)的硬件上進(jìn)行大量前期投資?!?/p>
盡管 GPU 的供應(yīng)鏈限制開(kāi)始有所緩解,但租賃市場(chǎng)仍在增長(zhǎng)。Grand View Research 的數(shù)據(jù)顯示,隨著對(duì)高級(jí)數(shù)據(jù)分析(如運(yùn)行機(jī)器學(xué)習(xí)算法)需求的增加,預(yù)計(jì)到 2030 年,2023 年價(jià)值 37.9 億美元的 GPU 即服務(wù)市場(chǎng)將以每年 21.5% 的速度增長(zhǎng),達(dá)到 122.6 億美元。
生成式 AI 激發(fā)了人們對(duì) GPU 租賃的興趣
自 2022 年 11 月 ChatGPT 問(wèn)世以來(lái),一些 GPU 租賃領(lǐng)域的初創(chuàng)公司發(fā)現(xiàn)需求急劇上升,因?yàn)槠髽I(yè)需要計(jì)算能力來(lái)構(gòu)建人工智能。
Vast.ai 創(chuàng)始人兼首席執(zhí)行官杰克?卡內(nèi)爾(Jake Cannell)表示,在生成式人工智能受到熱捧之前,他的公司主要客戶(hù)是加密貨幣礦工。如今,在 Vast.ai 的 GPU 租賃服務(wù)中,超過(guò)一半的項(xiàng)目與人工智能相關(guān)。卡內(nèi)爾稱(chēng),客戶(hù)包括人工智能企業(yè)家、初創(chuàng)公司和學(xué)者,他們使用 OpenAI 的 GPT 等基礎(chǔ)模型構(gòu)建自定義大型語(yǔ)言模型,并將大型語(yǔ)言模型(LLM)應(yīng)用于人工智能圖像生成器 Stable Diffusion 等人工智能相關(guān)工作負(fù)載。據(jù)卡內(nèi)爾介紹,ChatGPT 的發(fā)布,加上主要云提供商的高需求和 GPU 短缺,促使更多客戶(hù)尋找替代方案,這在一定程度上加速了 Vast.ai 的 GPU 租賃需求。這位執(zhí)行官說(shuō):“現(xiàn)在產(chǎn)量已經(jīng)跟上,情況可能有所緩解,但需求似乎依舊很高且在不斷增長(zhǎng)。”
Vast.ai 成立于 2017 年,它將英偉達(dá)和 AMD 的 GPU 集群所有者與尋求租用計(jì)算能力的組織聯(lián)系起來(lái)。據(jù)卡內(nèi)爾稱(chēng),截至 10 月底,市場(chǎng)提供 109 個(gè) GPU 集群,包括英偉達(dá)備受歡迎的 H100 芯片,這些集群位于數(shù)據(jù)中心,部分分布在美國(guó)、歐洲、亞洲和澳大利亞的數(shù)據(jù)庫(kù)中。
Vast.ai 通過(guò)提供不同容量、速度和系統(tǒng)要求的 GPU 集群,旨在讓租戶(hù)能夠自由選擇特定項(xiàng)目所需的 GPU,并根據(jù)需求靈活地?cái)U(kuò)展或縮小規(guī)模。例如,開(kāi)發(fā)人工智能聊天機(jī)器人的客戶(hù)最初可能租用 100 個(gè) GPU 來(lái)訓(xùn)練模型,后續(xù)可以通過(guò)租用數(shù)千個(gè) GPU 來(lái)提升計(jì)算能力。該公司稱(chēng),在產(chǎn)品開(kāi)發(fā)的不同階段能靈活獲取不同數(shù)量的計(jì)算能力,這使得 GPU 租賃比購(gòu)買(mǎi)芯片更具吸引力。
“只有當(dāng)對(duì) GPU 存在更可預(yù)測(cè)且長(zhǎng)期穩(wěn)定的需求時(shí),購(gòu)買(mǎi)才是有意義的,” 卡內(nèi)爾說(shuō)。
雖然像 Vast.ai 這類(lèi)在 ChatGPT 發(fā)布前就已成立的初創(chuàng)公司發(fā)現(xiàn)市場(chǎng)對(duì)其服務(wù)的興趣有所增加,但在聊天機(jī)器人發(fā)布后,也有新的初創(chuàng)公司涌現(xiàn),以利用日益增長(zhǎng)的 GPU 租賃市場(chǎng)。
Foundry 是一家專(zhuān)為人工智能工作負(fù)載打造的 GPU 市場(chǎng),據(jù)其首席執(zhí)行官賈里德?昆西?戴維斯(Jared Quincy Davis)稱(chēng),自 8 月份推出云平臺(tái)以來(lái),已經(jīng)吸引了 “數(shù)十家” 客戶(hù),并且能夠通過(guò)利用現(xiàn)有芯片的閑置算力大幅降低計(jì)算成本。
這家初創(chuàng)公司今年 3 月從紅杉資本和光速創(chuàng)投等投資者那里籌集了 8000 萬(wàn)美元,通過(guò)公司自有的計(jì)算集群以及從數(shù)據(jù)中心合作伙伴處獲得的 “未充分利用的集群” 來(lái)出租 GPU。
Foundry 的客戶(hù)包括技術(shù)、電信、媒體和保健行業(yè)的公司,基金會(huì)和學(xué)術(shù)實(shí)驗(yàn)室也在使用其服務(wù)。常見(jiàn)的應(yīng)用場(chǎng)景包括對(duì)模型(如 Meta 的 Llama)進(jìn)行微調(diào)以呈現(xiàn)所需特性、從零開(kāi)始構(gòu)建神經(jīng)網(wǎng)絡(luò)以及執(zhí)行情緒分析(一種用于分析文本情緒傾向的深度學(xué)習(xí)技術(shù))。Foundry 甚至允許客戶(hù)租用 GPU 來(lái)預(yù)測(cè)蛋白質(zhì)序列用于藥物研發(fā)、訓(xùn)練模型翻譯稀有語(yǔ)言,以及構(gòu)建無(wú)需人工干預(yù)就能控制網(wǎng)站的人工智能代理。
“許多以前只有 OpenAI 和 DeepMind 這類(lèi)實(shí)驗(yàn)室才能進(jìn)行的前沿開(kāi)發(fā),現(xiàn)在其他人也能做到了,因?yàn)?Foundry 讓 GPU 計(jì)算更易獲取且成本更低,” 戴維斯表示,他曾在 Google DeepMind 擔(dān)任工程師。
一些組織已經(jīng)從 GPU 租用中獲益。新澤西理工學(xué)院的教授貝德說(shuō),他看到自己所在的大學(xué)通過(guò) GPU 租賃為研發(fā)等 “關(guān)鍵活動(dòng)” 釋放資源。他認(rèn)為,GPU 租賃模式非常適合有 “臨時(shí)性” 或 “季節(jié)性計(jì)算需求” 的項(xiàng)目,并且 “省去了成本高昂的硬件管理和維護(hù)負(fù)擔(dān)”。貝德還表示,他看到小企業(yè)通過(guò)與大學(xué)合作,獲得了與大企業(yè)相同的 GPU 能力。
“我親眼見(jiàn)證了無(wú)數(shù)初創(chuàng)公司從中受益,” 貝德說(shuō),“他們不再需要投入數(shù)百萬(wàn)美元的前期資金來(lái)購(gòu)買(mǎi)專(zhuān)用硬件。相反,他們可以使用租來(lái)的 GPU 制作原型、測(cè)試和迭代算法,確保資金用于開(kāi)發(fā)而非基礎(chǔ)設(shè)施?!?/p>
長(zhǎng)期租用 GPU 可能并不省錢(qián)
不過(guò),貝德指出,租用 GPU 與購(gòu)買(mǎi) GPU 相比存在一些利弊。
共享基礎(chǔ)設(shè)施的性能可能不穩(wěn)定,一旦出現(xiàn)服務(wù)中斷,可能會(huì)減慢人工智能模型訓(xùn)練等任務(wù)的執(zhí)行速度。盡管前期成本能得到節(jié)省,但租用 GPU 的費(fèi)用可能會(huì)很高。貝德表示,在云和公司之間傳輸數(shù)據(jù)的成本可能會(huì) “快速攀升”,對(duì)于需要實(shí)時(shí)處理的工作負(fù)載,不斷遭遇延遲問(wèn)題的客戶(hù)最終可能花費(fèi)比購(gòu)買(mǎi) GPU 更多的費(fèi)用。對(duì)于有嚴(yán)格安全和合規(guī)要求的公司來(lái)說(shuō),缺乏對(duì)基礎(chǔ)設(shè)施的控制也可能是個(gè) “問(wèn)題”。
GPU 租賃市場(chǎng)的未來(lái)或許還取決于芯片行業(yè)的發(fā)展。畢竟,據(jù)貝德稱(chēng),像亞馬遜網(wǎng)絡(luò)服務(wù)這樣的主要云提供商預(yù)計(jì)會(huì)繼續(xù)拓展業(yè)務(wù)范圍,可能會(huì)吞并一些小公司,這在短期內(nèi)可能會(huì)使價(jià)格降低,但從長(zhǎng)遠(yuǎn)來(lái)看會(huì)限制消費(fèi)者的選擇。此外,供應(yīng)鏈延遲可能會(huì)讓云巨頭更難獲得 GPU。
盡管存在這些擔(dān)憂(yōu),初創(chuàng)公司仍然堅(jiān)信,隨著人工智能的持續(xù)發(fā)展,未來(lái)幾年市場(chǎng)對(duì)它們的服務(wù)仍有需求。Vast.ai 將繼續(xù)優(yōu)化其 GPU 匹配服務(wù),并更多地直接參與大型語(yǔ)言模型推理等應(yīng)用場(chǎng)景,特別是針對(duì)人工智能代理。Foundry 計(jì)劃發(fā)布更多功能,提升平臺(tái)的可用性,使其對(duì)構(gòu)建先進(jìn)模型的人工智能開(kāi)發(fā)人員更有幫助。
Vast.ai 首席執(zhí)行官卡內(nèi)爾說(shuō):“英偉達(dá)目前仍是行業(yè)領(lǐng)導(dǎo)者,我認(rèn)為這種情況不會(huì)在短期內(nèi)改變,但競(jìng)爭(zhēng)愈發(fā)激烈了?!?/p>
原文:observer