輝達 Nemotron 3 Super 奪開源 AI 模型榜首效能超越 DeepSeek

2026 年 5 月 5 日

輝達 Nemotron 3 Super 奪開源 AI 模型榜首效能超越 DeepSeek

商傳媒｜責任編輯／綜合外電報導

人工智慧領域再傳捷報，輝達（NVIDIA）旗下的開源 AI 模型 Nemotron 3 Super，近日在業界權威的 EnterpriseOps-Gym 基準測試排行榜上脫穎而出，勇奪榜首。這款在今年三月推出的 120B 參數模型，憑藉其創新的混合式架構及多項技術優勢，成功超越了包括 DeepSeek v3.2 和 Kimi-K2.5 在內的眾多競爭者，為開源 AI 生態系樹立了新標竿。

Nemotron 3 Super 模型的設計亮點在於其混合式 MoE（Mixture-of-Experts，混合專家）架構，並搭載 12B 活躍參數，旨在提供比前一代 Nemotron Super 模型高出 5 倍的吞吐量。該模型支援高達 1M token 的原生上下文視窗，使其在處理大型資料集和複雜任務時表現卓越。技術細節方面，Nemotron 3 Super 導入了 Latent MoE 技術，能在相同推論成本下，透過壓縮 token 有效呼叫 4 倍多的專家模型，顯著提升效率。此外，其 Multi-token prediction (MTP) 功能能夠在一次前向傳播中預測多個未來 token，大幅縮短長序列的生成時間，並內建推測解碼能力。

為強化效能，Nemotron 3 Super 採用了 Hybrid Mamba-Transformer 骨幹架構，將 Mamba 層的高序列處理效率與 Transformer 層的精準推理能力結合，不僅提升了吞吐量，也帶來 4 倍的記憶體與運算效率改善。更值得關注的是，該模型採用原生 NVFP4 預訓練，專為輝達最新的 Blackwell 架構進行優化，大幅降低記憶體需求，並在輝達 B200 GPU 上的推論速度比在輝達 H100 GPU 上使用 FP8 快 4 倍，同時維持高準確度。這項優化充分展現了軟硬體整合的巨大潛力，也突顯了高階 AI 晶片在推動模型效能躍進上的關鍵角色，而台灣在先進半導體製造領域扮演的核心地位，正是這些頂尖晶片得以實現的關鍵後盾。

根據《Wccftech》報導，EnterpriseOps-Gym 基準測試是一個全面的評估平台，包含 1,150 項任務和 512 種功能工具，要求 AI 代理在多個企業系統間協調以完成單一工作流程。Nemotron 3 Super 在這項嚴苛測試中以平均 27.3 分的成績位居開源模型排行榜榜首。該模型在 TEAMS、Email 和 Hybrid 等工作流程中表現領先，並在 CSM、ITSM 和 Drive 等流程中也展現強勁的競爭力。此次輝達模型擊敗了位居第二的 Kimi-K2.5 和第三名的 DeepSeek v3.2，而 GPT-OSS-120B 則排名第五。

Nemotron 3 Super 的成功不僅展現了輝達在 AI 模型領域的頂尖實力，也為開放原始碼 AI 社群注入新的活力。輝達 Nemotron 3 開源 AI 模型系列除了 Super 版本外，還包括 Nano 和 Ultra，並推出了 Nemotron 3 Nano Omni，能將代理 AI 吞吐量提升 9 倍，持續引領開源 AI 技術的發展。這也意味著，在高效能 AI 晶片技術的驅動下，開源模型的性能上限正不斷被突破，將為全球 AI 開發者帶來更多創新可能。