MiMo-V2.5-Pro는 Xiaomi의 플래그십 모델로, 일반적인 에이전트 기능, 복잡한 소프트웨어 엔지니어링 및 장기 작업에서 강력한 성능을 발휘하며 ClawEval, GDPVal, SWE-bench Pro와 같은 벤치마크에서 최상위권을 기록했습니다. 이 모델은 천 번 이상의 도구 호출을 통해 전문가가 며칠 또는 몇 주에 걸쳐 수행할 전문적인 작업을 독립적이고 자율적으로 완료할 수 있습니다. 최대 1M에 달하는 컨텍스트 길이를 갖추어 다양한 에이전트 프레임워크와 통합하기에 매우 적합합니다.
심층 사고|상용 모델
AI 성능 평가
Arena 종합 점수
1463
±8집계일 2026-05-01
종합 순위
22위
5,037 투표수
Arena 능력별 점수
복잡한 질문
1493±1117위
전문 지식
1506±268위
지시 이행
1468±1513위
대화 기억
1478±2122위
창의력
1428±2239위
코딩 실력
1511±1725위
수학 능력
1477±3215위
Arena 직군별 점수
문학·창작
1453±1819위
생활·사회과학
1501±205위
엔터·미디어
1431±1934위
경영·금융
1469±1920위
의학·보건
1492±3117위
법률·행정
1488±3014위
소프트웨어·IT
1502±1321위
수학·통계
1507±339위
종합
AA Intelligence Index
54%↑14%
추론·수학
GPQA Diamond
87%↑4%
HLE
34%↑16%
코딩
AA Coding Index
46%↑9%
TAU2
94%↑12%
TerminalBench
43%↑9%
SciCode
50%↑8%
언어·지시
IFBench
80%↑18%
AA-LCR
73%↑11%
출력 속도
일반 모드
68tok/s↓13
출력 시작 1.88s