Arena Math Elo

Name: Arena Math Elo
Creator: aib vote
License: https://www.gnu.org/licenses/gpl-3.0.html

About This Benchmark

Arena Elo score aggregated from user preference votes on math-related prompts.

Rank	Model
#1	Anthropic Claude Opus 4.6	1517
#2	OpenAI GPT-5.4	1515
#3	OpenAI GPT-5.4 Pro	1515
#4	Google Gemini 3.1 Pro	1509
#5	Anthropic Claude Opus 4.7	1496
#6	Alibaba Qwen3.6 Plus	1484
#7	Moonshot AI Kimi K2.5	1477
#8	Google Gemini 3 Flash	1476
#9	Z.ai GLM-5.1	1475
#10	Anthropic Claude Opus 4.5	1470
#11	Meta Muse Spark	1468
#12	Google Gemma 4 31B	1468
#13	Moonshot AI Kimi K2.6	1467
#14	Anthropic Claude Sonnet 4.6	1465
#15	Grok Grok 4.20	1457
#16	Grok Grok 4.20 (Reasoning)	1457
#17	Anthropic Claude Sonnet 4.5	1454
#18	Xiaomi MiMo-V2-Pro	1449
#19	Z.ai GLM-5	1447
#20	Baidu ERNIE 5.0 Thinking	1447
#21	DeepSeek DeepSeek V4 Pro	1446
#22	Alibaba Qwen3.5 397B A17B	1445
#23	Google Gemini 2.5 Pro	1444
#24	Anthropic Claude Opus 4.1	1443
#25	Google Gemini 3.1 Flash Lite	1438
#26	DeepSeek DeepSeek V4 Flash	1437
#27	OpenAI GPT-5	1434
#28	OpenAI GPT-5.4 Mini	1433
#29	Meituan Longcat Flash Chat	1429
#30	OpenAI GPT-5.4 Nano	1428
#31	DeepSeek DeepSeek V3.2	1428
#32	Grok Grok 4.1 Fast	1421
#33	Grok Grok 4.1 Fast (Reasoning)	1421
#34	Anthropic Claude Opus 4	1419
#35	MiniMax MiniMax M2.5	1411
#36	Google Gemini 2.5 Flash	1408
#37	OpenAI GPT-5 Mini	1406
#38	Anthropic Claude Sonnet 4	1402
#39	MiniMax MiniMax M2.7	1402
#40	Anthropic Claude Haiku 4.5	1392
#41	OpenAI GPT OSS 120B	1383
#42	NVIDIA Nemotron 3 Super	1378
#43	Google Gemini 2.5 Flash Lite	1364
#44	Arcee AI Trinity Large Thinking	1362
#45	OpenAI GPT-5 Nano	1344
#46	Amazon Nova 2 Lite	1334
#47	Meta Llama 4 Maverick	1319
#48	Meta Llama 4 Scout	1309
#49	OpenAI GPT-4.1	1303