Supermicro搶先布局NVIDIA Vera Rubin NVL72與HGX Rubin NVL8!新一代液冷AI解決方案問世

Super Micro Computer, Inc.作為AI、雲端、儲存和5G/邊緣領域的全方位IT解決方案供應商,宣布擴大製造產能、強化液冷技術,並與NVIDIA展開合作,推動NVIDIA Vera Rubin與Rubin平台最佳化資料中心級解決方案率先上市。

透過加速與NVIDIA的開發與合作,Supermicro能更有優勢地迅速部署旗艦級NVIDIA Vera Rubin NVL72與NVIDIA HGX™ Rubin NVL8系統。

而Supermicro經認證的資料中心建構組件解決方案(Data Center Building Block Solutions,DCBBS)可實現優化式製造程序、高度客製化方案,以及更快的部署時程,助力客戶在新一代AI基礎設施市場內取得關鍵性競爭優勢。

Supermicro總裁暨執行長梁見後表示:「Supermicro與NVIDIA的長期合作,以及我們具高彈性的建構組件(Building Block)解決方案,使我們能更快速地將最先進的AI平台推向市場。此外,我們也透過更高的製造產能和領先業界的液冷技術,以空前的速度、效率與穩定性,助力超大規模運算設施與企業大規模式地部署NVIDIA Vera Rubin與Rubin平台基礎設施。」

了解更多:https://www.supermicro.com/en/accelerators/nvidia/vera-rubin

旗艦級產品:

●  NVIDIA Vera Rubin NVL72 SuperCluster:此款頂級機櫃式系統搭載了72個NVIDIA Rubin GPU與36個NVIDIA Vera CPU,以及NVIDIA ConnectX®-9 SuperNIC和NVIDIA BlueField®-4 DPU,並透過NVIDIA NVLink 6建構出一個互連式平台。

同時,此機櫃式系統也可藉由NVIDIA Quantum-X800 InfiniBand與NVIDIA Spectrum-X Ethernet進行水平式擴充,近一步推動AI產業轉型。

NVIDIA Vera Rubin NVL72 SuperCluster可提供3.6 exaflops NVFP4算力、1.4 PB/s HBM4頻寬,以及75 TB的高速記憶體。

Vera Rubin 叢集

此平台是基於第三代NVIDIA MGX機櫃架構,具備卓越的可維護性、穩固性與可用性,而Supermicro也將該平台與更佳的資料中心級液冷技術進行整合,包括機櫃列間式(In-Row)冷卻液分配單元(CDU),能實現可擴充式的溫水冷卻運行,進而最小化電力消耗量與用水量,同時最大化運算密度與效率。

●  2U液冷NVIDIA HGX Rubin NVL8系統:這款緊湊型8-GPU系統針對AI與HPC工作負載進行了最佳化,可為大規模企業型智慧化應用中提供空前的效能與效率。

此系統可提供400 petaflops NVFP4算力、176 TB/s HBM4頻寬、28.8 TB/s NVLink傳輸頻寬,以及1600 Gb/s NVIDIA ConnectX-9 SuperNIC網路效能。Supermicro提供完善的機櫃級設計,以及最大化的部署彈性與多樣化的配置方案,包括能支援新一代Intel® Xeon®或AMD EPYC™等旗艦級x86 CPU。

此外,此系統也可依需求搭配高密度2U匯流排(Busbar)設計,並結合Supermicro領先業界的先進直接液冷(DLC)技術,實現最佳化機櫃整合。

NVIDIA Vera Rubin平台的重點規格與性能:

●  NVIDIA NVLink™ 6:此項高速互連技術可實現空前的GPU對GPU與CPU對GPU通訊效能,能適用於大規模混合專家(Mixture-of-Experts)模型的訓練與推論。

●   NVIDIA Vera CPU:由NVIDIA設計的客製化Arm核心,其效能為前一代核心的2倍。此CPU具有Spatial Multithreading技術(88核心/176執行緒)、1.2 TB/s LPDDR5X記憶體頻寬(容量提升3倍),和1.8 TB/s NVLink-C2C對GPU的連接頻寬(為前一代的2倍)。

●  第三代Transformer引擎:可針對長上下文(Long-Context)工作負載和擴大現今AI規模所需的Narrow-Precision運算,實現最佳化加速。

●  第三代機密運算(Confidential Computing):透過統一標準化的GPU級可信任執行環境(Trusted Execution Environment,TEE),提供機櫃級規模的機密運算性能,確保模型、資料與提示詞(Prompt)受到完善的保護與隔離。

●  第二代RAS引擎:提供更高的穩定性、可用性與可維護性,包括可在不停機(Downtime)的情況下進行即時性系統健康狀態檢測。

NVIDIA Vera Rubin平台也透過新推出的NVIDIA Spectrum-X Ethernet Photonics網路技術提供強大的性能優勢。

此技術採用Spectrum-6 Ethernet ASIC設計,並基於台積電3奈米製程,以及200G SerDes共同封裝光學(Co-Packaged Optics)與完全共享的緩衝架構,可提供102.4 Tb/s的交換器效能。

與傳統可插拔光學(Pluggable Optics)相比,該技術可實現5倍的能效、10倍的穩定性,以及5倍的應用程式運行時間。目前可提供的機型包括液冷式SN6800(具有409.6 Tb/s CPO和512個800G連接埠)、SN6810(具有102.4 Tb/s CPO和128個800G連接埠),以及SN6600(具有可插拔式設計和128個800G連接埠,並可搭配氣冷或液冷式散熱配置)。

同時,Supermicro亦提供基於Petascale全快閃儲存伺服器與JBOF系統的儲存解決方案。此項解決方案可支援NVIDIA BlueField-4 DPU,以執行多種類型的資料管理應用。

Supermicro在擴大製造產能及強化完善端到端液冷技術堆疊方面的策略,旨在最佳化完整液冷式NVIDIA Vera Rubin與Rubin平台的製造與部署。

這些技術與模組化資料中心建構組件解決方案架構進行結合後,可透過快速的結構配置、嚴謹的驗證,以及高密度平台的無縫式擴充,加速部署與啟動上線時程,進一步助力客戶取得領先市場的優勢。

史塔夫短評:高校能算力,助力AI發展!