NVIDIA、最高性能のオープンウェイトモデル「Nemotron 3 Ultra」を発表
- •NVIDIAは、米国製のオープンウェイトモデルとして過去最高レベルの知能を誇る「Nemotron 3 Ultra」を公開した。
- •モデルは5500億の総パラメータを擁しながら、秒間400トークンを超える高速な推論性能を実現している。
- •「Artificial Analysis Intelligence Index」において47.7というスコアを記録し、米国系オープンモデルの中で突出した性能を示した。
NVIDIAは2026年6月4日、同社最新のモデル「Nemotron 3 Ultra」をリリースした。本作は米国を拠点とするオープンウェイトモデルの中で、最も高い知能レベルを実現したモデルとなる。アーキテクチャには総パラメータ数約5500億、アクティブパラメータ数550億を採用しており、Nemotron 3シリーズにおいて最大規模のリリースだ。Artificial Analysisによる性能テストでは、NVFP4ウェイトを用いた場合に「Artificial Analysis Intelligence Index」で47.7を記録した。これは、Gemma 4 31Bの39.2や、同シリーズのNemotron 3 Superが記録した36.0を大きく上回る水準である。なお、gpt-oss-120bの33.3も凌駕しているが、中国系モデルKimi K2.6の53.9には届いていない。
Nemotron 3 Ultraの技術的な大きな特徴は、その推論効率にある。BlackBox AI上で展開した場合、毎秒400出力トークンを超える速度での運用が可能だ。これはgpt-oss-120bと比較して4倍以上のモデルサイズを持ちながら、より高速なサービングを実現するという顕著な技術的達成を意味する。「Terminal-Bench v2.1」を用いたエージェント評価においても、性能と時間のトレードオフを最適化することで、低レイテンシでタスクを完遂する高い能力を実証した。10、20、50、100ターンという4つのターンバジェットにおける検証では、パレート境界上に位置し、タスク完遂速度と正解精度の最適なバランスを維持している。
評価指標を見ると、特定のドメインにおけるモデルの能力が浮き彫りになる。「AA-Omniscience Non-Hallucination」ベンチマークでは71%のスコアを記録し、未知の事実に関する質問に対しても誤った回答を行うハルシネーションの傾向が低減されていることを示した。また、「GDPval-AA」におけるEloスコアは1378であり、DeepSeek V4 Flashと同等の性能水準にある。一方で、大学院レベルの物理学研究用ベンチマークである「CritPt」では3%にとどまり、Nemotron 3 Superと変わらない結果となった。Nemotron 3 Ultraは一般的な知能とエージェント効率において米国のオープンウェイト市場を牽引するものの、「Terminal-Bench Hard」および「SciCode」指標を含む複合コーディング指標においては、Gemma 4 31Bが約1ポイントの僅差で優位性を保っている。