正在閱讀:

2023年底,云計算“水逆”

掃一掃下載界面新聞APP

2023年底,云計算“水逆”

大廠宕機,“下云”可期?

文|科技新知 樟稻  

編輯丨伊頁

云計算,曾被無數(shù)科技大廠視為“市值壓艙石”,如今似乎遭遇了“滑鐵盧”。

老生常談的市場增速是最直觀的體現(xiàn)。IDC近期發(fā)布的《中國公有云服務市場(2023上半年)跟蹤報告》顯示,中國公有云市場的IaaS和PaaS增長僅為15.9%,是近三年的最低水平。

原因可以歸結(jié)于兩點。一是企業(yè)IT預算的增長未達預期。后疫情時代下的企業(yè),在預算制定和支出上變得更加謹慎,他們開始尋求更高效、成本更低的方案。這在很大程度上抑制了公有云市場的增長。

其次,互聯(lián)網(wǎng)云服務商為了保持利潤,做出了戰(zhàn)略上的調(diào)整。競爭加劇的市場環(huán)境中,這些廠商從追求收入轉(zhuǎn)變?yōu)樽非笥?,放棄了部分非盈利項目。這也導致了市場整體收入增長的放緩。

還有更為嚴重的挑戰(zhàn),可能正直接威脅到云計算技術基石的地位。

就在近段時間,海外,馬斯克的X平臺選擇離開云端以節(jié)約成本;國內(nèi),多家互聯(lián)網(wǎng)平臺因云產(chǎn)品引發(fā)了網(wǎng)站宕機。偶發(fā)的幾起事件,匯聚在一起,對云計算的效率和可靠性提出質(zhì)疑。

在成為科技大廠多年追求的熱門領域之后,云計算如今面臨著其發(fā)展歷程中最艱難的時刻。

X“下云”開先河

2023年10月27日,X的工程團隊發(fā)布了一篇詳盡的長帖,對過去一年中平臺架構所做的調(diào)整進行了總結(jié)。

最引人矚目的是X平臺嘗試“下云”所帶來的顯著成本變化。通過優(yōu)化對云服務提供商的使用,X平臺實現(xiàn)了月度云成本的60%降低。

具體來說,團隊將所有媒體/數(shù)據(jù)塊工件從云中遷移出來,降低了60%的云數(shù)據(jù)存儲大小,并將云數(shù)據(jù)處理成本降低了75%。

這一策略的調(diào)整明顯事出有因。據(jù)外媒報道,X平臺之前每年在AWS上的開銷高達1億美元。馬斯克收購后指示平臺削減云服務和額外的服務器空間,以期望每年節(jié)約高達10億美元的基礎設施成本。

盡管實際成效尚未完全明朗,但根據(jù)最新公布的數(shù)據(jù),“節(jié)約60%的月度云成本”意味著X平臺每年可能節(jié)省高達6000萬美元。

這一成績引起了“下云”倡導者的極大關注,其中包括Ruby on Rails框架創(chuàng)始人David Heinemeier Hansson(簡稱DHH)。今年6月,DHH 宣布其創(chuàng)始公司 37Signals 時隔6個月完成“下云”,將所有應用遷移至本地硬件。即使預留50萬美元用于意外開支,5年內(nèi)也可節(jié)約700萬美元的云成本。

他在《X celebrates 60% savings from cloud exit》一文中指出,對于首席財務官和投資者而言,這種成本節(jié)約是無法忽視的。如果像X平臺這樣的大型企業(yè)能夠在員工數(shù)量大幅減少的同時,通過“下云”措施獲得巨額利潤,那么對于其他大型企業(yè)而言,“下云”無疑是一個值得探索的領域。

不過,該觀點也有一些質(zhì)疑的聲音。例如,盡管X平臺在云計算上的支出減少了60%,但他們在本地化操作后的具體成本并未公開,這讓人們對整體成本效益產(chǎn)生了疑問。

業(yè)內(nèi)專家也指出,每年都有新聞報道客戶因為彈性伸縮云產(chǎn)品價格昂貴而選擇“下云”,節(jié)省了大量預算。但這并不意味著彈性伸縮云產(chǎn)品不適合所有客戶。這些新聞背后的真正問題,可能是產(chǎn)品經(jīng)理和銷售團隊的失職,他們未能合理設置價格策略,導致客戶流失。

傳統(tǒng)意義上,企業(yè)上云被認為是一種節(jié)省成本的策略。云計算的銷售人員經(jīng)常向企業(yè)領導強調(diào),通過遷移到云端的數(shù)字化管理轉(zhuǎn)型,可以在多個方面實現(xiàn)成本節(jié)約。其中包括數(shù)據(jù)管理、機房建設、專業(yè)運維人員的費用,以及其他與系統(tǒng)維護相關的綜合成本。

而云服務的立錐之地,一個關鍵優(yōu)勢在于靈活性和可擴展性。這意味著企業(yè)可以實時調(diào)整資源,而不需要承擔傳統(tǒng)IT基礎設施所帶來的高額成本和時間投入。

因此很長一段時間內(nèi),上云被視為企業(yè)降低運營成本、提高效率的理想選擇。

然而,隨著X平臺開了“下云”先河,人們開始重新審視云計算的成本效益,考慮云計算與本地化運營之間的平衡。

大廠宕機扯下遮羞布

近期,國內(nèi)大型互聯(lián)網(wǎng)平臺的網(wǎng)站服務紛紛遭遇崩潰,演繹了一出黑色幽默戲碼。

紅星資本局的報告顯示,近幾年每當應用程序崩潰,用戶便會迅速匯聚至各大社交平臺展開討論。當這些討論達到一定程度時,媒體便會關注這些事件,并可能使其登上各大平臺的熱搜榜。以此為依據(jù),2022年發(fā)生的崩潰事故大約有9起,而今年已有14起。

這一增長趨勢反映出技術問題的普遍性。

一位資深技術專家在分析宕機現(xiàn)象時,提出了IT系統(tǒng)的三層結(jié)構模型:最頂層為應用軟件,中間層是云平臺,最底層則是IT硬件。

他指出,當?shù)讓拥腎T硬件出現(xiàn)問題時,通??梢酝ㄟ^增加冗余系統(tǒng)或快速更換硬件來解決。但問題若發(fā)生在云平臺層面,其影響會顯著擴散,不僅影響單個應用,而且可能涉及多個應用。另一方面,如果應用可以打開但無法正常使用,則通常指向應用軟件層面的問題。

據(jù)此可以判斷,近期的App宕機潮與云平臺和應用軟件層面的問題密切相關。這一系列事件再次挑戰(zhàn)了云服務長期以來的可靠性口碑。

阿里系產(chǎn)品近期的集體故障顯然與其云服務的使用密切相關。其影響之廣,不僅是技術層面的問題,也與阿里采用的云服務特性有很大關系。

Flexera的《2022年云狀態(tài)報告》指出,89%的受訪企業(yè)在IT架構上采用了多云戰(zhàn)略。多云策略的優(yōu)勢在于它可以幫助企業(yè)保持議價能力,不受單一資源的限制,并避免技術架構與單一云服務商深度綁定。

這就對國內(nèi)的阿里系產(chǎn)品提出了挑戰(zhàn)。因為其大多使用的云服務實際上是自家業(yè)務的一部分。未來他們需要考慮是否將一部分業(yè)務轉(zhuǎn)移至其他云服務提供商,或是創(chuàng)建一個獨立的私有云,以此來分散和降低風險。

滴滴App的事故也源自云計算,外界普遍認為是與滴滴彈性云基于K8S的升級有關。

官方的內(nèi)部調(diào)查初步確定,事故起因是底層系統(tǒng)軟件發(fā)生故障,而非遭受攻擊;并承諾將深入進行技術風險隱患排查和升級工作,確保服務穩(wěn)定,努力避免類似事故再次發(fā)生。

另外,密集的突發(fā)事件還被解讀為是各大互聯(lián)網(wǎng)公司“降本增效”的裁員行為,影響到了技術、運維團隊的正常運作,導致技術服務和系統(tǒng)穩(wěn)定性受損。

盡管只是毫無根據(jù)地猜想,卻也映射出公眾對云服務故障的深切關注。未來用戶對于云服務故障事件的容忍度,可能會逐漸降低。

總之,云服務的一個關鍵風險——可靠性問題,正在暴露出來,尤其是在缺乏充分備份和故障轉(zhuǎn)移計劃的情況下。

誰來拯救云計算?

飛速發(fā)展的大趨勢下,問題往往被暫時隱藏在繁榮的表象之下。現(xiàn)在,探索云計算如何能夠重拾增長的腳步,并進一步優(yōu)化客戶體驗?這一切的關鍵,恰恰在于生成式人工智能的廣泛應用。

目前,大模型正在改變云計算的游戲規(guī)則,并逐漸成為行業(yè)共識。

一方面,龐大的語言模型在訓練和推理階段需要巨大的計算力。這一需求促使云服務商提供更加強大且高效的計算資源以支持模型訓練。

另一方面,大模型的流行也帶動了對云計算資源的額外需求,推動云計算的技術架構和產(chǎn)品布局發(fā)生變化。

IDC的研究主任Ewa Zborowska對此進行了深入闡述。具體來說,在生成式AI的快速發(fā)展和可擴展性方面,云計算扮演了催化劑的角色。

當下,即便沒有巨額的前期投資,高性能的計算資源如GPU和TPU也變得觸手可及。這讓組織可以集中精力在最重要的事情上:開發(fā)創(chuàng)新的生成式AI解決方案,而不必擔心任何基礎設施問題。

此外,云平臺為生成式AI提供的一個主要優(yōu)勢是管理對預訓練模型和API的訪問。預訓練模型集成了生成式AI專家的知識和技能,節(jié)約了大量的時間和計算資源。通過利用這些模型,開發(fā)者可以推進他們的項目,專注于微調(diào)和定制,而不是花費無數(shù)小時在模型訓練上。

企業(yè)當然也可以選擇自己構建和托管基礎模型,但這是一個非常昂貴、復雜且耗時的過程。而云服務商提供的API簡化了模型架構的復雜性,使得將生成式AI能力整合到現(xiàn)有和新建應用程序中變得更加簡單。

可以說,生成式AI的興起,加固了云計算不可或缺的基石地位。根據(jù)Gartner的預測,到2024年,主要需求將來自部署生成式AI能力的組織,他們的云基礎設施消耗預計將比2023年增長近27%。

盡管形勢一片大好,云服務商們也不能沉浸于現(xiàn)狀的自滿之中。在這條充滿不確定性的商業(yè)征途上,真正的驅(qū)動力是實際的經(jīng)濟效益。供應商們必須認識到,唯有持續(xù)創(chuàng)新和適應市場的不斷變化,才能保持領先。

比如,云服務商需要投資于硬件和芯片的研發(fā),增強針對生成式AI任務的硬件和芯片能力,甚至開發(fā)新型芯片來加速生成式AI的計算。只有不斷站穩(wěn)硬件層面的前沿,才可以提供更高的性能和成本效益。

另外,云服務商還需要開發(fā)行業(yè)特定或用例特定的AI框架,通過針對不同領域的獨特需求,實現(xiàn)差異化。只有通過這些專門的AI框架,才能使企業(yè)有效利用生成式AI,并推動特定行業(yè)的創(chuàng)新。

以上早已是今年上半年北美和中國云計算巨頭正在積極推進的策略。而眼下,云計算行業(yè)才正式邁入了決定其命運的下半場征程。

參考資料:

北京商報-今年App崩潰至少已有14起

IDC-Why Generative AI and Cloud Platforms Are a PerfectMatch

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。

Twitter

2.9k
  • 沙特駐阿富汗大使館復館
  • 馬斯克旗下xAI開始向X平臺所有用戶免費推出新版Grok-2模型

阿里巴巴

6.7k
  • 飛豬:2024年國內(nèi)租車訂單量同比增長約80%
  • 阿里國際站12月GMV同比增長30%

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

2023年底,云計算“水逆”

大廠宕機,“下云”可期?

文|科技新知 樟稻  

編輯丨伊頁

云計算,曾被無數(shù)科技大廠視為“市值壓艙石”,如今似乎遭遇了“滑鐵盧”。

老生常談的市場增速是最直觀的體現(xiàn)。IDC近期發(fā)布的《中國公有云服務市場(2023上半年)跟蹤報告》顯示,中國公有云市場的IaaS和PaaS增長僅為15.9%,是近三年的最低水平。

原因可以歸結(jié)于兩點。一是企業(yè)IT預算的增長未達預期。后疫情時代下的企業(yè),在預算制定和支出上變得更加謹慎,他們開始尋求更高效、成本更低的方案。這在很大程度上抑制了公有云市場的增長。

其次,互聯(lián)網(wǎng)云服務商為了保持利潤,做出了戰(zhàn)略上的調(diào)整。競爭加劇的市場環(huán)境中,這些廠商從追求收入轉(zhuǎn)變?yōu)樽非笥艞壛瞬糠址怯椖?。這也導致了市場整體收入增長的放緩。

還有更為嚴重的挑戰(zhàn),可能正直接威脅到云計算技術基石的地位。

就在近段時間,海外,馬斯克的X平臺選擇離開云端以節(jié)約成本;國內(nèi),多家互聯(lián)網(wǎng)平臺因云產(chǎn)品引發(fā)了網(wǎng)站宕機。偶發(fā)的幾起事件,匯聚在一起,對云計算的效率和可靠性提出質(zhì)疑。

在成為科技大廠多年追求的熱門領域之后,云計算如今面臨著其發(fā)展歷程中最艱難的時刻。

X“下云”開先河

2023年10月27日,X的工程團隊發(fā)布了一篇詳盡的長帖,對過去一年中平臺架構所做的調(diào)整進行了總結(jié)。

最引人矚目的是X平臺嘗試“下云”所帶來的顯著成本變化。通過優(yōu)化對云服務提供商的使用,X平臺實現(xiàn)了月度云成本的60%降低。

具體來說,團隊將所有媒體/數(shù)據(jù)塊工件從云中遷移出來,降低了60%的云數(shù)據(jù)存儲大小,并將云數(shù)據(jù)處理成本降低了75%。

這一策略的調(diào)整明顯事出有因。據(jù)外媒報道,X平臺之前每年在AWS上的開銷高達1億美元。馬斯克收購后指示平臺削減云服務和額外的服務器空間,以期望每年節(jié)約高達10億美元的基礎設施成本。

盡管實際成效尚未完全明朗,但根據(jù)最新公布的數(shù)據(jù),“節(jié)約60%的月度云成本”意味著X平臺每年可能節(jié)省高達6000萬美元。

這一成績引起了“下云”倡導者的極大關注,其中包括Ruby on Rails框架創(chuàng)始人David Heinemeier Hansson(簡稱DHH)。今年6月,DHH 宣布其創(chuàng)始公司 37Signals 時隔6個月完成“下云”,將所有應用遷移至本地硬件。即使預留50萬美元用于意外開支,5年內(nèi)也可節(jié)約700萬美元的云成本。

他在《X celebrates 60% savings from cloud exit》一文中指出,對于首席財務官和投資者而言,這種成本節(jié)約是無法忽視的。如果像X平臺這樣的大型企業(yè)能夠在員工數(shù)量大幅減少的同時,通過“下云”措施獲得巨額利潤,那么對于其他大型企業(yè)而言,“下云”無疑是一個值得探索的領域。

不過,該觀點也有一些質(zhì)疑的聲音。例如,盡管X平臺在云計算上的支出減少了60%,但他們在本地化操作后的具體成本并未公開,這讓人們對整體成本效益產(chǎn)生了疑問。

業(yè)內(nèi)專家也指出,每年都有新聞報道客戶因為彈性伸縮云產(chǎn)品價格昂貴而選擇“下云”,節(jié)省了大量預算。但這并不意味著彈性伸縮云產(chǎn)品不適合所有客戶。這些新聞背后的真正問題,可能是產(chǎn)品經(jīng)理和銷售團隊的失職,他們未能合理設置價格策略,導致客戶流失。

傳統(tǒng)意義上,企業(yè)上云被認為是一種節(jié)省成本的策略。云計算的銷售人員經(jīng)常向企業(yè)領導強調(diào),通過遷移到云端的數(shù)字化管理轉(zhuǎn)型,可以在多個方面實現(xiàn)成本節(jié)約。其中包括數(shù)據(jù)管理、機房建設、專業(yè)運維人員的費用,以及其他與系統(tǒng)維護相關的綜合成本。

而云服務的立錐之地,一個關鍵優(yōu)勢在于靈活性和可擴展性。這意味著企業(yè)可以實時調(diào)整資源,而不需要承擔傳統(tǒng)IT基礎設施所帶來的高額成本和時間投入。

因此很長一段時間內(nèi),上云被視為企業(yè)降低運營成本、提高效率的理想選擇。

然而,隨著X平臺開了“下云”先河,人們開始重新審視云計算的成本效益,考慮云計算與本地化運營之間的平衡。

大廠宕機扯下遮羞布

近期,國內(nèi)大型互聯(lián)網(wǎng)平臺的網(wǎng)站服務紛紛遭遇崩潰,演繹了一出黑色幽默戲碼。

紅星資本局的報告顯示,近幾年每當應用程序崩潰,用戶便會迅速匯聚至各大社交平臺展開討論。當這些討論達到一定程度時,媒體便會關注這些事件,并可能使其登上各大平臺的熱搜榜。以此為依據(jù),2022年發(fā)生的崩潰事故大約有9起,而今年已有14起。

這一增長趨勢反映出技術問題的普遍性。

一位資深技術專家在分析宕機現(xiàn)象時,提出了IT系統(tǒng)的三層結(jié)構模型:最頂層為應用軟件,中間層是云平臺,最底層則是IT硬件。

他指出,當?shù)讓拥腎T硬件出現(xiàn)問題時,通常可以通過增加冗余系統(tǒng)或快速更換硬件來解決。但問題若發(fā)生在云平臺層面,其影響會顯著擴散,不僅影響單個應用,而且可能涉及多個應用。另一方面,如果應用可以打開但無法正常使用,則通常指向應用軟件層面的問題。

據(jù)此可以判斷,近期的App宕機潮與云平臺和應用軟件層面的問題密切相關。這一系列事件再次挑戰(zhàn)了云服務長期以來的可靠性口碑。

阿里系產(chǎn)品近期的集體故障顯然與其云服務的使用密切相關。其影響之廣,不僅是技術層面的問題,也與阿里采用的云服務特性有很大關系。

Flexera的《2022年云狀態(tài)報告》指出,89%的受訪企業(yè)在IT架構上采用了多云戰(zhàn)略。多云策略的優(yōu)勢在于它可以幫助企業(yè)保持議價能力,不受單一資源的限制,并避免技術架構與單一云服務商深度綁定。

這就對國內(nèi)的阿里系產(chǎn)品提出了挑戰(zhàn)。因為其大多使用的云服務實際上是自家業(yè)務的一部分。未來他們需要考慮是否將一部分業(yè)務轉(zhuǎn)移至其他云服務提供商,或是創(chuàng)建一個獨立的私有云,以此來分散和降低風險。

滴滴App的事故也源自云計算,外界普遍認為是與滴滴彈性云基于K8S的升級有關。

官方的內(nèi)部調(diào)查初步確定,事故起因是底層系統(tǒng)軟件發(fā)生故障,而非遭受攻擊;并承諾將深入進行技術風險隱患排查和升級工作,確保服務穩(wěn)定,努力避免類似事故再次發(fā)生。

另外,密集的突發(fā)事件還被解讀為是各大互聯(lián)網(wǎng)公司“降本增效”的裁員行為,影響到了技術、運維團隊的正常運作,導致技術服務和系統(tǒng)穩(wěn)定性受損。

盡管只是毫無根據(jù)地猜想,卻也映射出公眾對云服務故障的深切關注。未來用戶對于云服務故障事件的容忍度,可能會逐漸降低。

總之,云服務的一個關鍵風險——可靠性問題,正在暴露出來,尤其是在缺乏充分備份和故障轉(zhuǎn)移計劃的情況下。

誰來拯救云計算?

飛速發(fā)展的大趨勢下,問題往往被暫時隱藏在繁榮的表象之下?,F(xiàn)在,探索云計算如何能夠重拾增長的腳步,并進一步優(yōu)化客戶體驗?這一切的關鍵,恰恰在于生成式人工智能的廣泛應用。

目前,大模型正在改變云計算的游戲規(guī)則,并逐漸成為行業(yè)共識。

一方面,龐大的語言模型在訓練和推理階段需要巨大的計算力。這一需求促使云服務商提供更加強大且高效的計算資源以支持模型訓練。

另一方面,大模型的流行也帶動了對云計算資源的額外需求,推動云計算的技術架構和產(chǎn)品布局發(fā)生變化。

IDC的研究主任Ewa Zborowska對此進行了深入闡述。具體來說,在生成式AI的快速發(fā)展和可擴展性方面,云計算扮演了催化劑的角色。

當下,即便沒有巨額的前期投資,高性能的計算資源如GPU和TPU也變得觸手可及。這讓組織可以集中精力在最重要的事情上:開發(fā)創(chuàng)新的生成式AI解決方案,而不必擔心任何基礎設施問題。

此外,云平臺為生成式AI提供的一個主要優(yōu)勢是管理對預訓練模型和API的訪問。預訓練模型集成了生成式AI專家的知識和技能,節(jié)約了大量的時間和計算資源。通過利用這些模型,開發(fā)者可以推進他們的項目,專注于微調(diào)和定制,而不是花費無數(shù)小時在模型訓練上。

企業(yè)當然也可以選擇自己構建和托管基礎模型,但這是一個非常昂貴、復雜且耗時的過程。而云服務商提供的API簡化了模型架構的復雜性,使得將生成式AI能力整合到現(xiàn)有和新建應用程序中變得更加簡單。

可以說,生成式AI的興起,加固了云計算不可或缺的基石地位。根據(jù)Gartner的預測,到2024年,主要需求將來自部署生成式AI能力的組織,他們的云基礎設施消耗預計將比2023年增長近27%。

盡管形勢一片大好,云服務商們也不能沉浸于現(xiàn)狀的自滿之中。在這條充滿不確定性的商業(yè)征途上,真正的驅(qū)動力是實際的經(jīng)濟效益。供應商們必須認識到,唯有持續(xù)創(chuàng)新和適應市場的不斷變化,才能保持領先。

比如,云服務商需要投資于硬件和芯片的研發(fā),增強針對生成式AI任務的硬件和芯片能力,甚至開發(fā)新型芯片來加速生成式AI的計算。只有不斷站穩(wěn)硬件層面的前沿,才可以提供更高的性能和成本效益。

另外,云服務商還需要開發(fā)行業(yè)特定或用例特定的AI框架,通過針對不同領域的獨特需求,實現(xiàn)差異化。只有通過這些專門的AI框架,才能使企業(yè)有效利用生成式AI,并推動特定行業(yè)的創(chuàng)新。

以上早已是今年上半年北美和中國云計算巨頭正在積極推進的策略。而眼下,云計算行業(yè)才正式邁入了決定其命運的下半場征程。

參考資料:

北京商報-今年App崩潰至少已有14起

IDC-Why Generative AI and Cloud Platforms Are a PerfectMatch

本文為轉(zhuǎn)載內(nèi)容,授權事宜請聯(lián)系原著作權人。