Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.
Nemotron 3 Super는 총 1,200억 매개변수에서 120억만 활성화하는 NVIDIA의 오픈 하이브리드 Mamba-Transformer MoE 모델입니다. Mamba 계층의 시퀀스 효율과 Transformer 계층의 정밀 추론을 결합한 하이브리드 구조로, 이전 세대 대비 5배 이상의 처리량을 달성합니다. Blackwell GPU에 최적화된 NVFP4 정밀도와 네이티브 100만 토큰 컨텍스트 창을 갖추고, PinchBench에서 85.6%로 오픈 모델 최고 점수를 기록하여 복잡한 다중 에이전트 활용, 소프트웨어 개발, 에이전트형 추론에 적합합니다.