LiveBench Coding

Name: LiveBench Coding
Creator: AIB
License: https://www.gnu.org/licenses/gpl-3.0.html

About This Benchmark

LiveBench Coding category score (0–100). Evaluates algorithm implementation, bug fixing, and code comprehension.

Rank	Model
#1	Anthropic Claude Fable 5	82.5
#2	OpenAI GPT-5.5	82.2
#3	Anthropic Claude Opus 4.7	82.1
#4	OpenAI GPT-5.6 Sol	81.8
#5	Moonshot AI Kimi K3	81.5
#6	Anthropic Claude Opus 5	80.7
#7	Anthropic Claude Sonnet 5	80.7
#8	Anthropic Claude Opus 4.5	79.7
#9	Z.ai GLM 5.2	79.7
#10	Anthropic Claude Opus 4.8	79.3
#11	Anthropic Claude Sonnet 4.6	79.3
#12	Google Gemini 3 Flash	78.6
#13	Moonshot AI Kimi K2.6	78.6
#14	Anthropic Claude Opus 4.6	78.2
#15	Google Gemini 3.5 Flash	78.2
#16	Alibaba Qwen3.6 Plus	78.2
#17	Google Gemini 3.6 Flash	77.9
#18	Moonshot AI Kimi K2.5	77.9
#19	OpenAI GPT-5.4	77.5
#20	Anthropic Claude Sonnet 4	77.5
#21	Meta Muse Spark 1.1	77.2
#22	OpenAI GPT-5.6 Luna	76.7
#23	Google Gemini 3.1 Pro	76.5
#24	Anthropic Claude Sonnet 4.5	76.1
#25	Google Gemini 3.5 Flash-Lite	76.1
#26	OpenAI GPT-5 Mini	76.1
#27	DeepSeek DeepSeek V3.2	75.7
#28	Google Gemini 2.5 Pro	75.7
#29	Z.ai GLM-5.1	75.4
#30	OpenAI GPT-5.6 Terra	75.4
#31	Anthropic Claude Opus 4.1	74.7
#32	Alibaba Qwen: Qwen3.7 Max	74.2
#33	Moonshot AI Kimi K2.7 Code	74.0
#34	Z.ai GLM 5V Turbo	73.9
#35	Z.ai GLM-5	73.6
#36	Anthropic Claude Haiku 4.5	72.2
#37	OpenAI GPT-5	72.1
#38	OpenAI GPT-5.4 Mini	71.6
#39	NVIDIA Nemotron 3 Ultra	71.3
#40	OpenAI GPT-5.4 Nano	70.8
#41	MiniMax MiniMax M2.5	70.7
#42	DeepSeek DeepSeek V4 Pro	70.0
#43	xAI Grok 4.3	69.9
#44	xAI Grok 4.1 Fast (Reasoning)	69.6
#45	DeepSeek DeepSeek V4 Flash	69.2
#46	Xiaomi MiMo V2 Pro	68.8
#47	xAI Grok 4.5	68.6
#48	Google Gemini 3.1 Flash Lite	68.5
#49	MiniMax MiniMax M3	68.2
#50	OpenAI GPT-5 Nano	67.4
#51	Google Gemini 2.5 Flash Lite	66.4
#52	xAI Grok 4.20 (Reasoning)	66.1
#53	Google Gemini 2.5 Flash	66.0
#54	Arcee AI Trinity Large Thinking	65.7
#55	xAI Grok Build 0.1	65.4
#56	Alibaba Qwen3.6 Flash	64.9
#57	Google Gemma 4 31B	60.3
#58	OpenAI GPT OSS 120B	60.2
#59	xAI Grok 4.20	58.5
#60	MiniMax MiniMax M2.7	54.9
#61	xAI Grok 4.1 Fast	54.3
#62	NVIDIA Nemotron 3 Super	54.1