1 / 3
左右にスワイプ

NVIDIA Nemotron™ 3 Nano Omniは、エンタープライズエージェントシステムにおいて認識およびコンテキスト把握を行うサブエージェントとして設計された、30B-A3Bのオープンマルチモーダルモデルです。テキスト、画像、動画、音声の入力を受け取り、テキストを出力することで、単一の推論ループ内で複数のモダリティを横断した認識と推論を可能にします。ハイブリッドなMoE Transformer-MambaアーキテクチャにConv3Dビデオレイヤーと効率的なビデオサンプリング(EVS)を組み合わせることで、従来の視覚・音声パイプラインを個別に処理する場合と比較して、動画推論におけるスループットを約2倍に向上させ、計算コストを2.5倍削減しました。最大300Kのコンテキスト長と16,384の推論予算をサポートし、推論を通じた拡張思考機能も備えています。

提供元
NVIDIANVIDIA
リリース日
2026-04-28
学習完了日
非公開
ライセンス
商用モデル
入出力形式
コンテキスト長
256K / 66K
API入出力 (1M)
利用方法
出力速度
Arena 総合
Intelligence Index
Coding Index
Math Index
LiveBench
ForecastBench
GPQA Diamond
HLE
MMLU-Pro
AIME 2025
MATH-500
LB 推論
LB 数学
LB データ分析
LiveCodeBench
LB コーディング
LB エージェンティック
TAU2
TerminalBench
SciCode
IFBench
AA-LCR
幻覚率 (HHEM)
事実一貫性 (HHEM)
LB 言語
LB 指示