Arena, 3년치 AI 리더보드 데이터셋 전격 공개
Arena AI
2026년 4월 3일 (금)
- •Arena가 3년 동안 축적된 AI 모델 리더보드의 전체 역사적 데이터셋을 Hugging Face에 공개했다.
- •해당 데이터는 텍스트, 비전, 비디오를 포함한 10개 영역에 걸쳐 수백 개의 모델을 포괄한다.
- •이번 공개를 통해 모델 성능의 종단적 연구와 오픈소스 및 폐쇄형 모델의 발전 추이 분석이 가능해졌다.
Arena 팀이 10개 영역의 AI 벤치마킹 기록을 담은 3년 치 아카이브를 공식적으로 개방했다. Hugging Face에 호스팅된 이 공개 저장소는 2023년 5월 이후 수백 개의 모델이 어떻게 진화해 왔는지 세밀하게 보여준다. 특히 정적인 스냅샷을 넘어, 연구자들은 이제 최상위 모델 점수가 3년도 채 되지 않아 약 1,000점에서 1,500점 가까이 치솟는 '진보의 행보'를 직접 추적할 수 있게 되었다.
데이터셋은 텍스트, 비전, 비디오 생성 등 다양한 모달리티를 다루는 하위 집합으로 꼼꼼하게 구성되어 있다. 또한 최신 순위와 전체 기록을 분리하여 제공함으로써, 동일한 변수가 장기간에 걸쳐 어떻게 변화하는지 관찰하는 심도 있는 종단적 연구를 지원한다. 실제로 사용자는 모델 종류의 폭발적인 증가를 시각화하거나 코딩 및 이미지 편집 등 다양한 도메인에서 오픈소스와 폐쇄형 라이선스의 도입 속도를 직접 비교 분석할 수 있다.
단순한 순위 외에도 여러 영역에 대해 스타일 제어가 적용된 변형 데이터가 포함된 점도 주목할 만하다. 이는 모델이 단순히 공손하거나 형식이 잘 갖춰진 답변을 내놓는다는 이유로 높은 점수를 받는 것을 방지하며, 대신 추론의 실제 품질과 정확성을 바탕으로 평가받도록 보장한다. 무엇보다 이러한 개방형 과학에 대한 헌신은 인공지능 개발 트렌드를 정밀하게 조사하고 전 세계적으로 미세 조정 인프라의 성숙도를 평가하는 데 필요한 실증적 도구를 커뮤니티에 제공한다.