NVIDIA

Nemotron 3 Nano Omni

Name: NVIDIA Nemotron 3 Nano Omni
Author: NVIDIA

비교

2026-04-28

비교

NVIDIA Nemotron™ 3 Nano Omni는 기업용 에이전트 시스템에서 인식 및 문맥 파악을 담당하는 서브 에이전트로 설계된 30B-A3B 오픈 멀티모달 모델입니다. 텍스트, 이미지, 비디오, 오디오 입력을 받아 텍스트를 출력하며, 단일 추론 루프 내에서 다양한 모달리티를 인식하고 추론할 수 있게 합니다. 하이브리드 MoE Transformer-Mamba 아키텍처와 Conv3D 비디오 레이어, 효율적인 비디오 샘플링(EVS) 기술을 기반으로 하여, 별도의 비전 및 음성 파이프라인을 사용할 때보다 비디오 추론 처리량이 약 2배 높고 연산 비용은 2.5배 낮습니다. 최대 300K의 컨텍스트 길이와 16,384의 추론 예산을 지원하며, 추론을 통한 확장된 사고 기능을 제공합니다.

비전심층 사고|상용 모델

학습 완료일

비공개

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

256KIN66KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

—

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

AI 성능 평가

종합

AA Intelligence Index

21%↓20%

추론·수학

GPQA Diamond

47%↓37%

HLE

5.3%↓15%

코딩

AA Coding Index

15%↓23%

TAU2

45%↓39%

TerminalBench

8.3%↓27%

SciCode

28%↓15%

언어·지시

IFBench

63%↓1%

AA-LCR

36%↓28%

출력 속도

일반 모드

300tok/s↑216

출력 시작 7.24s

출처:Artificial Analysis

NVIDIA

Nemotron 3 Nano Omni

비교

2026-04-28

비교

비전심층 사고|상용 모델

학습 완료일

비공개

이 AI가 학습을 마친 날짜입니다. 이후 발생한 사건이나 정보는 알지 못할 수 있습니다.

입력 형식 → 출력 형식

이 AI에게 전달할 수 있는 정보 유형과, AI가 생성할 수 있는 결과물 유형을 나타냅니다.

처리용량

256KIN66KOUT

한 번의 요청에서 AI가 한꺼번에 읽고 처리할 수 있는 최대 분량입니다. 숫자가 클수록 긴 문서나 대화를 처리할 수 있습니다.

개별 비용(백만 글자)

—

이 AI를 직접 연동해 사용할 때 발생하는 비용입니다. 텍스트 100만 단위(토큰)당 달러 기준으로 표시됩니다.

비용 계산하기

AI 성능 평가

종합

AA Intelligence Index

21%↓20%

추론·수학

GPQA Diamond

47%↓37%

HLE

5.3%↓15%

코딩

AA Coding Index

15%↓23%

TAU2

45%↓39%

TerminalBench

8.3%↓27%

SciCode

28%↓15%

언어·지시

IFBench

63%↓1%

AA-LCR

36%↓28%

출력 속도

일반 모드

300tok/s↑216

출력 시작 7.24s

출처:Artificial Analysis

NVIDIA