供應鏈_Vera_Rubin_NVL72機櫃

主題

Vera Rubin NVL72 是 NVIDIA 第二代 Oberon rack-scale 架構,把單一機櫃視為一個分散式加速器。相較 GB200 / GB300,核心變化不是單一 GPU 規格,而是 rack-level extreme co-design:compute tray 模組化、節點內 cableless、100% 液冷、50V 機櫃供電、NVLink 6 雙向 SerDes,以及更受限的 hyperscaler 客製化空間。

來源 memo_SemiAnalysis_Vera_Rubin_NVL72_20260520 指出,每套 VR NVL72 包含 72 顆 Rubin GPU package、36 顆 Vera CPU、36 顆 NVLink 6 Switch ASIC;Rubin GPU 預設功耗 profile 分為 1,800W Max-Q 與 2,300W Max-P,對應整櫃約 180-220kW 級 TDP。這使機櫃供應鏈從「組裝 GPU server」升級為「共同設計電、熱、訊號、機構與自動化裝配」。

供應鏈關係更新

既有 memo_VeraRubin_機櫃連接器供應鏈_20260519 將機架整合 ODM 廣泛列為鴻海、廣達、緯穎、緯創等;SemiAnalysis 2026-05-20 進一步指出,Rubin compute tray L10 自動化組裝能力目前只有 Foxconn、Quanta、Wistron 三家。這不等於其他 ODM 不能做 L11 rack integration,但 L10 自動化 tray 產能門檻更集中。

供應鏈結構圖

flowchart TB
    A[NVIDIA VR NVL72 reference design<br/>72 Rubin GPU + 36 Vera CPU + 36 NVLink 6 Switch] --> B[Compute Tray<br/>Strata / Orchid / Midplane / PDB / BF4 / SMM]
    A --> C[NVLink 6 Switch Tray<br/>36 switch ASICs / rack]
    A --> D[Rack Power<br/>4 x 110kW shelves / 50V busbar]
    A --> E[100% Liquid Cooling<br/>cold plate / manifold / QD / CDU]
    A --> F[Scale-out Network<br/>CX-9 / OSFP / CPO or pluggable]

    B --> B1[High-end PCB + CCL<br/>M8/M9, HVLP4, possible quartz cloth]
    B --> B2[Paladin HD2 B2B connectors<br/>Amphenol]
    B --> B3[SOCAMM memory connector<br/>Vera CPU memory]
    B --> B4[L6 PCBA + L10 tray automation<br/>Foxconn / Quanta / Wistron]

    E --> E1[Cold plates<br/>AVC / Delta / Boyd / CoolIT / Auras]
    E --> E2[QDs<br/>CPC / Danfoss / Staubli / Parker]
    E --> E3[CDU / facility cooling<br/>Delta / Schneider / Vertiv / nVent]

    D --> D1[Power shelves / PSU]
    D --> D2[Liquid-cooled busbar]
    D --> D3[HVDC / BBU / CBU / power rack]

    classDef core fill:#a5d8ff
    classDef material fill:#b2f2bb
    classDef thermal fill:#c3fae8
    classDef power fill:#ffd8a8
    classDef customer fill:#fff3bf
    class A,B,C,F core
    class B1,B2,B3,B4 material
    class E,E1,E2,E3 thermal
    class D,D1,D2,D3 power

圖解

圖說:VR NVL72 compute tray 由 Strata、Orchid、midplane、power delivery、BlueField-4、system management 六類模組構成;核心設計目標是消除 tray 內線纜,降低組裝時間與失效率。

圖說:Strata 承載 2 顆 Rubin GPU + 1 顆 Vera CPU + SOCAMM;Orchid 把 CX-9 NIC 與 OSFP cage 移到前端;midplane 成為前後模組的 PCIe / 管理訊號橋接板。

圖說:Rubin 的 tray topology 將 CX-9 NIC 從 Strata 移到 Orchid,讓高速 200G Ethernet / InfiniBand 訊號距離縮短,較低速的 PCIe Gen6 走較長 PCB 路徑;這是 cableless 設計成立的關鍵。

圖說:VR NVL72 compute tray 轉為 100% liquid cooled,冷卻液由 UQD 進出 tray,經 internal manifold 分配到各模組冷板;Rubin GPU 冷板升級為 micro-channel cold plate,並以鍍金表面對應液態金屬 TIM2 腐蝕風險。

圖說:VR NVL72 rack reference design 使用四組 110kW power shelves,以 N+1 支援 220kW 級整櫃 TDP;50V busbar 電流規格上升到 5,000A+,且因無風扇架構需要液冷 busbar。Compute tray 端,50V 先到 Strata 或 PDB,再降到 12V / sub-1V。

圖說:SemiAnalysis 指出 Rubin compute tray 自動化組裝能力集中在 Foxconn、Quanta、Wistron;L6 PCBA 以 Wistron / Foxconn 為主,L11 則由各 ODM / OEM 把 tray 組入 rack。

架構拆解

層級Rubin 變化供應鏈意義
GPU / CPURubin GPU 3nm、HBM4;Vera CPU 採 SOCAMM,C2C 頻寬提高HBM4 pin speed、SOCAMM、CPU memory module 成為平台節奏風險
Compute tray2 Strata + 4 Orchid + midplane + PDB + BF4 / management由 cable assembly 轉向 B2B connector + 高階 PCB / CCL
Scale-upNVLink 6 採雙向 SerDes;36 顆 NVLink switch ASIC / rackSwitch tray、NVLink backplane、Paladin HD2、M8+ PCB 升級
Scale-out每 GPU 1.6T,常見假設為 2 x 800G OSFP1.6T optical / AEC / CPO 部署由客戶網路架構決定
ThermalCompute tray 100% liquid cooled,移除風扇Cold plate、manifold、MQD / UQD、CDU、pump content 增加
PowerRack 180-220kW;4 x 110kW shelves;50V / 5,000A+ busbarPower shelf、busbar、PDB、IBC、VRM、HVDC power rack 同步升級
AssemblyL10 tray 自動化從 2 小時降到約 5 分鐘自動化 fixture、blind mate、loading mechanism 與良率成門檻

各環節廠商

Compute Tray / Rack 組裝

層級主要廠商角色備註
L6 PCBA3231_緯創(市)2317_鴻海(市)Board-level PCBASemiAnalysis 指出兩者為 Blackwell / Rubin 主要供應商
L10 compute tray automation2317_鴻海(市)2382_廣達(市)3231_緯創(市)自動化 tray 組裝Rubin 最關鍵集中環節;小型 ODM 可外包給三家或自行低效率組裝
L11 rack integration各 ODM / OEM;台股映射含 2317_鴻海(市)2382_廣達(市)3231_緯創(市)6669_緯穎(市)將 compute tray 組入 rack是否拿到 Rubin L10 自動化份額需逐家驗證

連接器 / PCB / 材料

環節廠商 / 技術變化
Board-to-board connectorAmphenol Paladin HD2;台股映射觀察 3217_優群(櫃) CABB取代 compute tray 內 flyover cable,訊號經 midplane PCB
SOCAMMAmphenol、嘉澤、鴻海、3217_優群(櫃)(既有 memo)Vera CPU 記憶體模組化;詳見 技術_SOCAMM2
High-end PCBStrata / Orchid / midplane / NVSwitch board高階 PCB 面積相對 GB300 約 2.3x;Orchid 是增量主因
CCL / 銅箔M8 / M9、HVLP4、可能導入 quartz clothPCIe Gen6 長距離 PCB 與 NVLink 6 雙向 SerDes 對 insertion loss 更敏感
台股映射3037_欣興(市)2383_台光電(市)8046_南電(市)需以客戶認證與材料 share 追蹤,不直接等同 Rubin 訂單

液冷

環節廠商 / 技術變化
Cold plateAVC、Delta、Boyd、CoolIT、Auras;台股映射 3017_奇鋐(市)8996_高力(市)Strata 覆蓋 GPU / CPU / SOCAMM / VRM;Orchid 也加冷板
QD / MQD / UQDColder Products Company、Danfoss、Staubli、Parker Hannifin高流量使 QD、manifold、piping 尺寸升級;2 inch QD 可能足以支援下一代 flow
Manifold / TCS3017_奇鋐(市)8996_高力(市)Internal manifold 移到 tray 中央;冷板與模組在 L6 後段整合
CDU / facility coolingDelta、Schneider Electric、Vertiv、nVentRack 熱負載約翻倍;10 racks / CDU 若維持,CDU 容量需往 3-6MW
Dry cooler / adiabatic towerSPX、BAC、Evapco45C inlet 讓 chiller-less 更可行,但短中期不會一夕取代 chiller

電源

環節變化受惠 / 觀察
Rack power shelves4 x 110kW,N+1;415-480VAC 轉 50VDCPSU、power shelf、機櫃電源整合
Busbar50V busbar 額定 5,000A+,需液冷Busbar、液冷結構件、絕緣與安全件
Compute tray power50V 進 Strata,IBC 轉 12V,再由 VRM 轉 sub-1V詳見 供應鏈_AI伺服器板上電源技術_DrMOS
Power rackHVDC 800V / OCP +/-400V、BBU、CBU、SST客戶自研差異大;Meta high power rack 是一條方向

Network / Optical

環節變化供應鏈意義
NVLink 6 scale-up36 顆 switch ASIC / rack;每 switch tray 4 顆NVSwitch board 32 layers、M8+ CCL、冷板與 SMM
Copper backplane雙向 SerDes 使 cable 數量不需翻倍若不用雙向 SerDes,背板銅纜可能從約 5,000 條走向 10,000 條,製造風險過高
Scale-out NIC每 GPU 1.6T,常見為 2 x 800G OSFP1.6T pluggable / AEC / CPO 路線取決於 hyperscaler network
CPORubin 世代 scale-out 開始出現部分 CPO 部署詳見 供應鏈_光通訊供應鏈_CPO_D-FAU技術_COUPE

競爭格局

  • NVIDIA 控制力提高:Rubin 的 modular / cableless reference design 限制 hyperscaler 在前半段 chassis 的客製化自由度。可客製區域主要剩 power delivery、BlueField-4 / 自研 DPU、management module,但外形與尺寸仍要貼合 NVIDIA midplane。
  • 組裝門檻集中:GB300 前半段高度客製化,供應商組合分散;Rubin 則因 blind mate、B2B connector、MQD、內部 manifold 與自動化裝配,L10 tray automation 變成少數大廠門檻。
  • 電熱訊號共設計:高功耗不只是散熱問題,也推動 50V / HVDC、液冷 busbar、M8/M9 CCL、HVLP4 銅箔、B2B connector 同步升級。
  • 散熱 content/MW 提升:100% 液冷、流量提升、前端模組冷板化,使 QD、manifold、cold plate、pump 的單 MW 內容提升;CDU 受惠但彈性可能低於 QD / manifold / cold plate。
  • PCB 與連接器受惠邏輯改變:flyover cable 在 tray 內下降,但 B2B connector、midplane、高階 PCB / CCL 上升;Amphenol 仍受惠,台股則需追蹤 SOCAMM / CABB / CCL / PCB 認證。

投資觀察點

  1. L10 自動化份額2317_鴻海(市)2382_廣達(市)3231_緯創(市)誰掌握 Rubin tray automation 量產良率與客戶 mix。
  2. L11 與 L10 的分工6669_緯穎(市)等 rack ODM 若不是 L10 自動化主供,是否透過 L11 rack integration、客戶設計、或外包 tray 取得價值。
  3. PCB / CCL 材料定案:Orchid / midplane 是否維持 quartz cloth,或降回高階玻纖;這會影響材料 ASP 與良率。
  4. 液冷流量與 CDU ratio:營運商是否維持約 10 racks / CDU;若 rack 熱負載翻倍,CDU 容量與 pump / QD 規格會同步升級。
  5. Power rack 採用節奏:HVDC / BBU / CBU / liquid-cooled busbar 是否從 Meta 等 hyperscaler 擴散到更廣平台。
  6. BlueField-4 替代率:CoreWeave / neocloud 可能採 BF4;大型 hyperscaler 多半用自研 DPU 或較便宜 CX-9,影響 NVIDIA DPU 與自研模組供應鏈。
  7. CPO / AEC mix:Meta / xAI 等客戶在 1.6T AEC、pluggable optics、CPO 上的選擇,會重塑光通訊與高速線纜供應鏈。

風險

  • HBM4 pin speed 與供應風險:SemiAnalysis 指出 NVIDIA 目標 HBM4 22TB/s,但初期供應商可能較接近 20TB/s;Micron 在 Rubin HBM4 份額風險較高。
  • 客戶規格差異:power rack、DPU、management、scale-out network 都有 hyperscaler 自研變體,reference design 不等於所有客戶 BOM。
  • 材料降規:quartz cloth 若因成本與加工良率降回玻纖,高階材料受惠幅度可能低於早期預期。
  • Chiller-less 不會線性取代 chiller:45C inlet 改善 economizer 空間,但 mixed hall、備援、可靠度與 workload 彈性仍讓 chiller 保有中期需求。
  • TCO 壓力:VR NVL72 per-GPU capital cost 高於 GB300;Max-P 2,300W 的運行成本可能使客戶選擇 Max-Q 或降功耗 profile。

相關頁面

來源