LCR (Long Context Recall)

Name: LCR (Long Context Recall)
Creator: aib vote
License: https://www.gnu.org/licenses/gpl-3.0.html

About This Benchmark

A benchmark evaluating the ability to accurately recall specific information from long documents. Measures long-context retrieval and processing capability. Score is accuracy (%).

Source: Artificial Analysis

Rank	Model
#1	Anthropic Claude Opus 4.5	74.0%
#2	OpenAI GPT-5.4	74.0%
#3	Google Gemini 3.1 Pro	72.7%
#4	Anthropic Claude Opus 4.6	70.7%
#5	Anthropic Claude Haiku 4.5	70.3%
#6	Anthropic Claude Opus 4.7	70.3%
#7	Meta Muse Spark	69.7%
#8	Alibaba Qwen3.6 Plus	69.7%
#9	MiniMax MiniMax M2.7	68.7%
#10	Grok Grok 4.1 Fast (Reasoning)	68.0%
#11	Anthropic Claude Opus 4.1	66.3%
#12	DeepSeek DeepSeek V4 Pro	66.3%
#13	Google Gemini 3 Flash	66.3%
#14	Google Gemini 2.5 Pro	66.0%
#15	MiniMax MiniMax M2.5	66.0%
#16	Anthropic Claude Sonnet 4.5	65.7%
#17	Google Gemini 3.1 Flash Lite	65.3%
#18	Moonshot AI Kimi K2.5	65.3%
#19	DeepSeek DeepSeek V3.2	65.0%
#20	Anthropic Claude Sonnet 4	64.7%
#21	OpenAI GPT-5	63.7%
#22	Z.ai GLM-5	63.3%
#23	DeepSeek DeepSeek V4 Flash	63.0%
#24	Z.ai GLM-5.1	62.3%
#25	Google Gemma 4 31B	62.0%
#26	Google Gemini 2.5 Flash	61.7%
#27	OpenAI GPT-5.4 Mini	61.3%
#28	OpenAI GPT-4.1	61.0%
#29	Xiaomi MiMo-V2-Pro	60.7%
#30	NVIDIA Nemotron 3 Super	60.0%
#31	Anthropic Claude Sonnet 4.6	58.7%
#32	Grok Grok 4.20 (Reasoning)	58.0%
#33	Alibaba Qwen3.5 397B A17B	58.0%
#34	OpenAI GPT-5.4 Nano	57.3%
#35	Google Gemini 2.5 Flash Lite	48.0%
#36	Meta Llama 4 Maverick	46.0%
#37	Mistral AI Mistral Small 4	44.7%
#38	OpenAI GPT OSS 120B	43.7%
#39	OpenAI GPT-5 Nano	40.0%
#40	OpenAI GPT-5 Mini	35.7%
#41	Anthropic Claude Opus 4	33.7%
#42	Arcee AI Trinity Large Thinking	33.0%
#43	Meta Llama 4 Scout	25.8%
#44	Meituan Longcat Flash Chat	25.7%
#45	Grok Grok 4.1 Fast	22.0%
#46	Amazon Nova 2 Lite	17.7%
#47	Grok Grok 4.20	17.3%
#48	Baidu ERNIE 5.0 Thinking	6.7%
#49	Baidu ERNIE 4.5 300B A47B	2.3%