訊息平台

輝達 Nemotron 3 Super 奪開源 AI 模型榜首 效能超越 DeepSeek

商傳媒|責任編輯/綜合外電報導

人工智慧領域再傳捷報,輝達(NVIDIA)旗下的開源 AI 模型 Nemotron 3 Super,近日在業界權威的 EnterpriseOps-Gym 基準測試排行榜上脫穎而出,勇奪榜首。這款在今年三月推出的 120B 參數模型,憑藉其創新的混合式架構及多項技術優勢,成功超越了包括 DeepSeek v3.2 和 Kimi-K2.5 在內的眾多競爭者,為開源 AI 生態系樹立了新標竿。

Nemotron 3 Super 模型的設計亮點在於其混合式 MoE(Mixture-of-Experts,混合專家)架構,並搭載 12B 活躍參數,旨在提供比前一代 Nemotron Super 模型高出 5 倍的吞吐量。該模型支援高達 1M token 的原生上下文視窗,使其在處理大型資料集和複雜任務時表現卓越。技術細節方面,Nemotron 3 Super 導入了 Latent MoE 技術,能在相同推論成本下,透過壓縮 token 有效呼叫 4 倍多的專家模型,顯著提升效率。此外,其 Multi-token prediction (MTP) 功能能夠在一次前向傳播中預測多個未來 token,大幅縮短長序列的生成時間,並內建推測解碼能力。

為強化效能,Nemotron 3 Super 採用了 Hybrid Mamba-Transformer 骨幹架構,將 Mamba 層的高序列處理效率與 Transformer 層的精準推理能力結合,不僅提升了吞吐量,也帶來 4 倍的記憶體與運算效率改善。更值得關注的是,該模型採用原生 NVFP4 預訓練,專為輝達最新的 Blackwell 架構進行優化,大幅降低記憶體需求,並在輝達 B200 GPU 上的推論速度比在輝達 H100 GPU 上使用 FP8 快 4 倍,同時維持高準確度。這項優化充分展現了軟硬體整合的巨大潛力,也突顯了高階 AI 晶片在推動模型效能躍進上的關鍵角色,而台灣在先進半導體製造領域扮演的核心地位,正是這些頂尖晶片得以實現的關鍵後盾。

根據《Wccftech》報導,EnterpriseOps-Gym 基準測試是一個全面的評估平台,包含 1,150 項任務和 512 種功能工具,要求 AI 代理在多個企業系統間協調以完成單一工作流程。Nemotron 3 Super 在這項嚴苛測試中以平均 27.3 分的成績位居開源模型排行榜榜首。該模型在 TEAMS、Email 和 Hybrid 等工作流程中表現領先,並在 CSM、ITSM 和 Drive 等流程中也展現強勁的競爭力。此次輝達模型擊敗了位居第二的 Kimi-K2.5 和第三名的 DeepSeek v3.2,而 GPT-OSS-120B 則排名第五。

Nemotron 3 Super 的成功不僅展現了輝達在 AI 模型領域的頂尖實力,也為開放原始碼 AI 社群注入新的活力。輝達 Nemotron 3 開源 AI 模型系列除了 Super 版本外,還包括 Nano 和 Ultra,並推出了 Nemotron 3 Nano Omni,能將代理 AI 吞吐量提升 9 倍,持續引領開源 AI 技術的發展。這也意味著,在高效能 AI 晶片技術的驅動下,開源模型的性能上限正不斷被突破,將為全球 AI 開發者帶來更多創新可能。