ARC-AGI-3

Updated Jul 12, 2026·387 views

Problem Count: 135
Institution: Independent
Category: General Evaluation
Metrics: Accuracy
Language: English
Difficulty: Mixed

Overview

A general abstract-reasoning benchmark designed to evaluate adaptive problem solving and machine intelligence.

Related resources

Latest ARC-AGI-3 model rankings and full benchmark leaderboard

Browse the latest scores, model modes, release dates, and parameter sizes for ARC-AGI-3.

Source: DataLearnerAI

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Model Mode Legend

License:

Origin:

Model release cutoff:

Rank	Model				License
	GPT-5.6 Terra Thinking Level · Max	0.8	2026-06-26	Unknown	Closed
	GPT-5.6 Luna Thinking Level · Max	0.2	2026-06-26	Unknown	Closed
	Claude Opus 4.6 Thinking Level · Max	0.0045	2026-02-05	Unknown	Closed
4	GPT-5.5 Thinking Level · High	0.0043	2026-04-23	Unknown	Closed
5	Gemini 3.1 Pro Preview Thinking Level · High	0.004	2026-02-20	Unknown	Closed
6	GPT-5.4 Thinking Level · High	0.002	2026-03-05	Unknown	Closed
7	Opus 4.7 Thinking Level · High	0.0018	2026-04-16	Unknown	Closed
8	Grok 4.20 Thinking Enabled	0.001	2026-03-09	Unknown	Closed

Latest ARC-AGI-3 model rankings and full benchmark leaderboard

ARC-AGI-3 Rank