LiveBench 데이터 분석 카테고리 점수 (0~100). 표·그래프 해석, 통계 추론, 데이터 기반 결론 도출 능력을 평가합니다.
OpenAI
GPT-5.5
GPT-5.4
Google
Gemini 3.1 Pro
Anthropic
Claude Opus 4.7
Claude Sonnet 4.6
Alibaba
Qwen3.6 Plus
Claude Opus 4.6
Z.ai
GLM-5
Moonshot AI
Kimi K2.6
GLM-5.1
Grok
Grok 4.20 (Reasoning)
Kimi K2.5
Gemma 4 31B
GPT-5
MiniMax
MiniMax M2.7
Gemini 3.1 Flash Lite
Claude Sonnet 4
Grok 4.1 Fast (Reasoning)
Gemini 2.5 Pro
GPT-5 Mini
MiniMax M2.5
Xiaomi
MiMo-V2-Pro
Claude Opus 4.1
Gemini 3 Flash
GPT-5.4 Mini
Gemini 2.5 Flash
Gemini 2.5 Flash Lite
Claude Sonnet 4.5
Claude Haiku 4.5
DeepSeek
DeepSeek V3.2
GPT-5 Nano
Claude Opus 4.5
Grok 4.20
Grok 4.1 Fast
Arcee AI
Trinity Large Thinking
GPT-5.4 Nano
GPT OSS 120B
NVIDIA
Nemotron 3 Super