Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.
심층 사고|공개 모델
출처:공식 문서
AI 성능 평가
Arena 종합 점수
1361
±7집계일 2026-04-23
종합 순위
142위
7,408 투표수
Arena 능력별 점수
복잡한 질문
1381±9140위
전문 지식
1398±24118위
지시 이행
1347±13145위
대화 기억
1349±17147위
창의력
1301±19174위
코딩 실력
1408±14140위
수학 능력
1378±25129위
Arena 직군별 점수
문학·창작
1324±15159위
생활·사회과학
1366±17154위
엔터·미디어
1317±17151위
경영·금융
1349±16156위
의학·보건
1351±26167위
법률·행정
1368±26150위
소프트웨어·IT
1404±11137위
수학·통계
1398±28109위
종합
AA Intelligence Index
36%↓2%
LiveBench
32%↓28%
추론·수학
GPQA Diamond
80%↓1%
HLE
19%↑2%
LB 추론
34%↓25%
LB 수학
36%↓37%
LB 데이터 분석
21%↓28%
코딩
AA Coding Index
31%↓3%
LB 코딩
54%↓20%
LB 에이전틱
23%↓20%
TAU2
68%↓5%
TerminalBench
29%↓2%
SciCode
36%↓5%
언어·지시
IFBench
72%↑15%
AA-LCR
60%↓2%
LB 언어
30%↓42%
LB 지시
28%↓18%
출력 속도
일반 모드
80tok/s↓2
출력 시작 1.88s
추론 모드
158tok/s↑70
출력 시작 13.70s