首頁 導報現場 正文

亞馬遜云科技打造AI定制版IaaS“樣板房”,兼顧強大、高效與安全

2025-03-27 17:47 中國發展網 成靜
亞馬遜云科技 IDC

摘要:日前,在全球市場分析機構國際數據公司(IDC)發布的《2025年IDC MarketScape:全球公有云基礎設施即服務(IaaS)報告》中,亞馬遜云科技被評為“領導者”,在能力和戰略的雙維度上均為“領導者”。

中國發展網訊 記者成靜報道 日前,在全球市場分析機構國際數據公司(IDC)發布的《2025年IDC MarketScape:全球公有云基礎設施即服務(IaaS)報告》中,亞馬遜云科技被評為“領導者”,在能力和戰略的雙維度上均為“領導者”。IDC在該報告中表示,全球公有云IaaS繼續快速增長,預計2025年的整體規模將達到1880億美元。

IDC在該報告中指出,AI正在通過多種方式重塑云基礎設施。AI帶動了對GPU、TPU和FPGA等專用硬件的大量投資;改善了自動化基礎設施管理的運營效率和成本;推動了安全升級,企業需要以AI驅動型安全工具來響應日益復雜的威脅;提供需求預測以優化資源分配;推動開發AI驅動的服務與應用等。報告中,IDC為技術買家提供一系列的建議,其中重點提及了部署決策的原則、AI功能的集成度以及系統可觀測性相關的安全性:工作負載部署決策不能僅局限于成本考量,服務集成度、供應商服務的廣度,以及對互操作性和開放標準的支持力度,均至關重要;將AI功能集成到云基礎設施中也越來越成為一個關鍵的差異化因素;建議優先選擇具備強大開箱即用安全功能,且對系統可觀測性有全面方案的供應商。

據了解,亞馬遜云科技自2006年成立以來,在基礎設施覆蓋的范圍、以及IaaS領域涵蓋的核心服務如計算、網絡、安全等多個方面進行持續擴展及創新。特別是在AI領域,亞馬遜首席執行官Andy Jassy在2025年2月的第四季度財報電話會議中表示,亞馬遜在2025年的資本投資預計達1000億美元,其中大部分將用于亞馬遜云科技AI基礎設施的建設等。具體表現在四個方面:

——亞馬遜云科技的基礎設施遍及36個地理區域的114個可用區,并已公布計劃在新西蘭和沙特阿拉伯等新建4個區域、12個可用區。同時,為了支持AI創新并滿足客戶不斷變化的需求,亞馬遜云科技持續推動數據中心本身的創新,包括簡化電氣和機械設計,在冷卻、機架設計和控制系統進行創新。Anthropic計算部門杰出工程師James Bradbury表示:“亞馬遜云科技的設計改進顯著提升了基礎設施的安全性、可擴展性和效率,為AI模型的運行和創新提供了強有力的支撐。”

——作為全球云計算的開創者和引領者,亞馬遜云科技是率先進入自研芯片領域的云供應商。革命性的Nitro虛擬化平臺全面加速了亞馬遜云科技在自研芯片領域的創新速度。迄今為止,亞馬遜云科技已推出了多個系列的自研芯片,包括Amazon Nitro系統、通用處理器芯片Amazon Graviton、機器學習訓練芯片Amazon Trainium和推理芯片Amazon Inferentia,同時保持穩定的更新頻率,且每次更新均提供兩位數以上的百分比的性價比提升。在2024年的re:Invent上,亞馬遜云科技推出全面升級的Amazon Trainium2芯片,以及基于該芯片的Amazon EC2 Trn2實例和超級服務器。Amazon EC2 Trn2實例與當前基于GPU的EC2 P5e和P5en實例相比,Amazon EC2 Trn2實例的性價比提升30-40%。單實例配備16個Trainium2芯片,可提供高達20.8 Petaflops浮點算力的性能,非常適合訓練和推理高達數十億參數的大型語言模型。

Amazon EC2 Trn2 UltraServers服務器是亞馬遜云科技在縱向擴展領域的又一次突破,用以滿足大規模生成式AI訓練和實時推理的性能需求。此外,亞馬遜云科技發布了新一代AI訓練芯片Amazon Trainium3。Trainium3是亞馬遜云科技首款采用3納米工藝制造的芯片。搭載Trainium3的UltraServers性能預計將是Trn2 UltraServers的4倍。首批基于Trainium3的實例預計將在2025年末上線。

——亞馬遜云科技在2024年re:Invent上推出了第二代UltraCluster網絡架構,也稱為"10p10u"網絡,支持超過20,000個GPU協同工作,帶寬達10Pb/s,延遲低于10μs(微秒),這一突破性的性能躍遷將模型訓練時間縮短至少15%。同時還推出了兼具中央控制和優化及分布式的速度和彈性的SIDR(Scalable, Intent Driven Routing)全新網絡路由協議。相比傳統的BGP、OSPF等協議,SIDR在亞馬遜云科技的10p10u網絡中能在不到1秒內恢復網絡,速度比傳統方法快10倍,顯著提升了分布式AI訓練中的可靠性和實時性,確保網絡在故障發生時也能保持高效運行。10p10u是亞馬遜云科技有史以來擴展最快的網絡,在2024年,安裝了超過300萬條鏈路。

——亞馬遜云科技認為“安全是設計出來的”,無論是基礎設施還是服務,從設計之初就應該將安全作為首要任務,并嵌入到從架構到操作的各個環節,從而為客戶提供靈活、安全的云計算環境。亞馬遜云科技還不斷使用創新技術提升基礎設施的安全性,例如亞馬遜云科技通過自動推理技術實現以可驗證的方式提升系統的可觀測性,為關鍵系統按預期運行提供了嚴格的數學保證。正如亞馬遜云科技CEO Matt Garman所說:“萬事皆以安全性為起始。在亞馬遜云科技,安全性是眾多客戶放心將云工作負載托付給我們的原因之一。它是所有服務構建所依托的核心基礎層。”

正如IDC在報告中提到:“亞馬遜云科技在服務范圍方面無可匹敵,其眾多服務通常會在其盛大的年度re:Invent大會上發布。豐富的服務種類使亞馬遜云科技對需要專業能力、混合基礎設施或高度可擴展應用程序的企業具有吸引力。”“當需要最廣泛的云服務組合以及經過驗證的可擴展性和創新能力時,可以考慮亞馬遜云科技。”

IDC分析師、報告作者Dave McCarthy表示:“亞馬遜云科技通過廣泛的服務組合和持續的創新,在公有云IaaS市場中處于領導地位。廣泛的全球基礎設施,結合Amazon Graviton等定制芯片計劃以及在AI領域的重大投資,使其在滿足企業需求方面獨具優勢。其在可擴展性方面的卓越表現、成熟的開發者社區以及對AI基礎設施的積極投入,使其成為需要先進云能力的企業的首選。”

責任編輯:成靜


返回首頁
相關新聞
返回頂部
国产福利一区二区麻豆