AI 모델 비교

NVIDIA Nemotron™ 3 Nano Omni는 기업용 에이전트 시스템에서 인식 및 문맥 파악을 담당하는 서브 에이전트로 설계된 30B-A3B 오픈 멀티모달 모델입니다. 텍스트, 이미지, 비디오, 오디오 입력을 받아 텍스트를 출력하며, 단일 추론 루프 내에서 다양한 모달리티를 인식하고 추론할 수 있게 합니다. 하이브리드 MoE Transformer-Mamba 아키텍처와 Conv3D 비디오 레이어, 효율적인 비디오 샘플링(EVS) 기술을 기반으로 하여, 별도의 비전 및 음성 파이프라인을 사용할 때보다 비디오 추론 처리량이 약 2배 높고 연산 비용은 2.5배 낮습니다. 최대 300K의 컨텍스트 길이와 16,384의 추론 예산을 지원하며, 추론을 통한 확장된 사고 기능을 제공합니다.

제공사

NVIDIA

출시일

2026-04-28

학습완료일

미공개

라이선스

상용 모델

입출력 형식

처리용량

256K / 66K

API 입출력 (1M)

—

사용 방법

—

출력 속도

—

Arena 종합

—

Intelligence Index

—

Coding Index

—

Math Index

—

LiveBench

—

ForecastBench

—

GPQA Diamond

—

HLE

—

MMLU-Pro

—

AIME 2025

—

MATH-500

—

LB 추론

—

LB 수학

—

LB 데이터 분석

—

LiveCodeBench

—

LB 코딩

—

LB 에이전틱

—

TAU2

—

TerminalBench

—

SciCode

—

IFBench

—

AA-LCR

—

환각률 (HHEM)

—

사실 일관성 (HHEM)

—

LB 언어

—

LB 지시

—

비용 계산하기 AI 모델 상세 페이지

1 / 3

좌우로 스와이프

제공사