AIモデル比較

NVIDIA Nemotron™ 3 Nano Omniは、エンタープライズエージェントシステムにおいて認識およびコンテキスト把握を行うサブエージェントとして設計された、30B-A3Bのオープンマルチモーダルモデルです。テキスト、画像、動画、音声の入力を受け取り、テキストを出力することで、単一の推論ループ内で複数のモダリティを横断した認識と推論を可能にします。ハイブリッドなMoE Transformer-MambaアーキテクチャにConv3Dビデオレイヤーと効率的なビデオサンプリング（EVS）を組み合わせることで、従来の視覚・音声パイプラインを個別に処理する場合と比較して、動画推論におけるスループットを約2倍に向上させ、計算コストを2.5倍削減しました。最大300Kのコンテキスト長と16,384の推論予算をサポートし、推論を通じた拡張思考機能も備えています。

提供元

NVIDIA

リリース日

2026-04-28

学習完了日

非公開

ライセンス

商用モデル

入出力形式

コンテキスト長

256K / 66K

API入出力 (1M)

—

利用方法

—

出力速度

—

Arena 総合

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 推論

—

LB 数学

—

LB データ分析

—

LiveCodeBench

—

LB コーディング

—

LB エージェンティック

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

幻覚率 (HHEM)

—

事実一貫性 (HHEM)

—

LB 言語

—

LB 指示

—

コスト計算 AIモデル詳細ページ

1 / 3

左右にスワイプ

提供元