LiveBench 言語

Name: LiveBench 言語
Creator: aib vote
License: https://www.gnu.org/licenses/gpl-3.0.html

このベンチマークについて

LiveBench言語カテゴリスコア（0〜100）。文章補完、言語理解、文体分析、翻訳品質などを評価します。

順位	モデル
#1	OpenAI GPT-5.5	87.7
#2	Google Gemini 3.1 Pro	85.4
#3	Anthropic Claude Opus 4.6	83.3
#4	OpenAI GPT-5.4	82.6
#5	OpenAI GPT-5	80.7
#6	Google Gemini 3 Flash	78.7
#7	Grok Grok 4.20 (Reasoning)	77.7
#8	Moonshot AI Kimi K2.5	77.7
#9	Z.ai GLM-5	77.5
#10	Anthropic Claude Opus 4.5	77.2
#11	Anthropic Claude Sonnet 4.5	76.0
#12	Google Gemini 2.5 Pro	75.5
#13	Moonshot AI Kimi K2.6	75.1
#14	Alibaba Qwen3.6 Plus	75.0
#15	Anthropic Claude Opus 4.7	74.6
#16	Grok Grok 4.1 Fast (Reasoning)	74.3
#17	Google Gemini 3.1 Flash Lite	73.2
#18	Anthropic Claude Sonnet 4	72.9
#19	Anthropic Claude Opus 4.1	72.8
#20	Z.ai GLM-5.1	71.8
#21	Anthropic Claude Sonnet 4.6	71.4
#22	Google Gemma 4 31B	71.3
#23	OpenAI GPT-5 Mini	69.2
#24	Xiaomi MiMo-V2-Pro	69.1
#25	MiniMax MiniMax M2.7	66.8
#26	DeepSeek DeepSeek V3.2	64.2
#27	Google Gemini 2.5 Flash	62.3
#28	Anthropic Claude Haiku 4.5	57.0
#29	MiniMax MiniMax M2.5	55.1
#30	Google Gemini 2.5 Flash Lite	52.0
#31	Grok Grok 4.1 Fast	50.0
#32	OpenAI GPT OSS 120B	48.6
#33	OpenAI GPT-5 Nano	47.7
#34	Arcee AI Trinity Large Thinking	42.1
#35	Grok Grok 4.20	42.0
#36	OpenAI GPT-5.4 Mini	41.8
#37	NVIDIA Nemotron 3 Super	30.0
#38	OpenAI GPT-5.4 Nano	28.7