이 기사의 핵심 내용은?

NVIDIA가 미국 기반의 오픈 가중치 모델 중 가장 지능적인 성능을 갖춘 Nemotron 3 Ultra를 출시했다. 이 모델은 5500억 개의 총 매개변수를 갖췄으며 초당 400 토큰 이상의 추론 속도를 구현했다. Artificial Analysis Intelligence Index에서 47.7점을 기록하며 미국 주도 오픈 모델 중 최고점을 달성했다.

NVIDIA, 오픈 가중치 모델 Nemotron 3 Ultra 공개

•NVIDIA가 미국 기반의 오픈 가중치 모델 중 가장 지능적인 성능을 갖춘 Nemotron 3 Ultra를 출시했다.
•이 모델은 5500억 개의 총 매개변수를 갖췄으며 초당 400 토큰 이상의 추론 속도를 구현했다.
•Artificial Analysis Intelligence Index에서 47.7점을 기록하며 미국 주도 오픈 모델 중 최고점을 달성했다.

NVIDIA는 2026년 6월 4일, 미국 기반의 오픈 가중치 모델 중 가장 뛰어난 지능을 갖춘 Nemotron 3 Ultra를 공개했다. 이 모델의 아키텍처는 총 5500억 개의 매개변수와 550억 개의 활성 매개변수로 구성되어 Nemotron 3 시리즈 중 최대 규모를 자랑한다. 특히 Artificial Analysis의 성능 평가에서 NVFP4 가중치를 사용하여 47.7점이라는 높은 점수를 기록했다. 이는 Gemma 4 31B(39.2점)와 Nemotron 3 Super(36.0점) 등 다른 미국산 오픈 가중치 모델을 크게 앞서는 수치이다. 다만 53.9점을 기록한 중국의 Kimi K2.6보다는 낮은 점수를 보였다.

기술적 강점은 추론 효율성에 있다. BlackBox AI 환경에서 모델은 초당 400 토큰 이상의 출력 속도를 기록했다. 이는 gpt-oss-120b보다 4배 이상 크면서도 더 빠른 서빙 성능을 유지하는 엔지니어링 성과다. 또한 Terminal-Bench v2.1을 이용한 에이전트 평가에서 10, 20, 50, 100 턴에 걸친 성능 테스트 결과, 작업 완료 속도와 정확도 사이의 최적 균형점인 파레토 프런티어를 지속적으로 점유했다.

분야별 평가 지표에서도 모델의 역량은 두드러진다. AA-Omniscience 비할루시네이션 벤치마크에서 71%를 기록하며 정보가 불충분한 질의에 대한 오답 생성 가능성을 낮췄다. GDPval-AA에서는 Elo 점수 1378점을 기록해 DeepSeek V4 Flash와 대등한 수준을 보였다. 반면 대학원 수준의 물리학 연구 벤치마크인 CritPt 점수는 3%에 그쳐 Nemotron 3 Super와 동일했다. 현재 미국 오픈 가중치 시장에서 일반 지능과 에이전트 효율성 부문을 선도하고 있으나, 코딩 지표(Terminal-Bench Hard 및 SciCode 포함)에서는 Gemma 4 31B가 여전히 약 1점 앞서 있다.

NVIDIA는 2026년 6월 4일, 미국 기반의 오픈 가중치 모델 중 가장 뛰어난 지능을 갖춘 Nemotron 3 Ultra를 공개했다. 이 모델의 아키텍처는 총 5500억 개의 매개변수와 550억 개의 활성 매개변수로 구성되어 Nemotron 3 시리즈 중 최대 규모를 자랑한다. 특히 Artificial Analysis의 성능 평가에서 NVFP4 가중치를 사용하여 47.7점이라는 높은 점수를 기록했다. 이는 Gemma 4 31B(39.2점)와 Nemotron 3 Super(36.0점) 등 다른 미국산 오픈 가중치 모델을 크게 앞서는 수치이다. 다만 53.9점을 기록한 중국의 Kimi K2.6보다는 낮은 점수를 보였다.

기술적 강점은 추론 효율성에 있다. BlackBox AI 환경에서 모델은 초당 400 토큰 이상의 출력 속도를 기록했다. 이는 gpt-oss-120b보다 4배 이상 크면서도 더 빠른 서빙 성능을 유지하는 엔지니어링 성과다. 또한 Terminal-Bench v2.1을 이용한 에이전트 평가에서 10, 20, 50, 100 턴에 걸친 성능 테스트 결과, 작업 완료 속도와 정확도 사이의 최적 균형점인 파레토 프런티어를 지속적으로 점유했다.

분야별 평가 지표에서도 모델의 역량은 두드러진다. AA-Omniscience 비할루시네이션 벤치마크에서 71%를 기록하며 정보가 불충분한 질의에 대한 오답 생성 가능성을 낮췄다. GDPval-AA에서는 Elo 점수 1378점을 기록해 DeepSeek V4 Flash와 대등한 수준을 보였다. 반면 대학원 수준의 물리학 연구 벤치마크인 CritPt 점수는 3%에 그쳐 Nemotron 3 Super와 동일했다. 현재 미국 오픈 가중치 시장에서 일반 지능과 에이전트 효율성 부문을 선도하고 있으나, 코딩 지표(Terminal-Bench Hard 및 SciCode 포함)에서는 Gemma 4 31B가 여전히 약 1점 앞서 있다.