ARC-AGI-2

Name: ARC-AGI-2
Creator: 个人

人工智能（AI）的通用智能（AGI）发展一直是研究领域的焦点。近期，由 ARC Prize 基金会推出并由 AI 研究者 François Chollet 联合发起的 ARC-AGI-2 评测基准，为衡量大模型在未知情境下的实时推理能力和学习效率提供了新的视角。

更新于 2026-03-25

2,354 次浏览

问题数量

1000

发布机构

个人

评测类别

综合评估

评测指标

Accuracy

支持语言

英文

难度等级

高难度

简介

极具挑战性的大模型通用能力评测基准

ARC-AGI-2 Model Score Leaderboard

Source: DataLearnerAI

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

模式说明:

normal

thinking

low

medium

high

deeper thinking

parallel_thinking

图表加载中...

Latest ARC-AGI-2 model rankings and full benchmark leaderboard

Browse the latest scores, model modes, release dates, and parameter sizes for ARC-AGI-2.

已排除 1 条并行模式成绩

排名	模型
1	Gemini 3 Deep Think - 2620 Thinking Level · Medium	84.6	2026-02-13	未知
2	GPT-5.4 Pro Normal	83.3	2026-03-05	未知
3	GPT-5.4 Pro Thinking Level · High	83.3	2026-03-05	未知
4	Gemini 3.1 Pro Preview Thinking Level · High	77.1	2026-02-20	未知
5	GPT-5.4 Normal	77.1	2026-03-05	未知
6	GPT-5.4 Deep Thinking	74	2026-03-05	未知
7	Claude Opus 4.6 Deep Thinking	66.3	2026-02-05	未知
8	Claude Opus 4.6 Thinking Level · Low	64.6	2026-02-05	未知
9	Claude Sonnet 4.6 Thinking Level · Medium	58.3	2026-02-17	未知
10	GPT-5.4 Thinking Level · Medium	55.4	2026-03-05	未知
11	GPT-5.2 Parallel · Deep Thinking	54.2	2025-12-11	未知
12	GPT-5.2 Pro Thinking Level · Medium	54.2	2025-12-11	未知
13	GPT-5.2 Deep Thinking	52.9	2025-12-11	未知
14	GPT-5.2 Thinking Level · High	43.3	2025-12-11	未知
15	Claude Opus 4.5 Thinking Level · Medium	37.6	2025-11-25	未知
16	Gemini 3.0 Flash Thinking Level · Medium	33.6	2025-12-17	未知
17	Gemini 3.0 Pro (Preview 11-2025) Thinking Level · Medium	31.1	2025-11-18	未知
18	GPT-5.4 Thinking Level · Low	29.2	2026-03-05	未知
19	GPT-5.2 Thinking Level · Medium	26.7	2025-12-11	未知
20	GPT-5-Pro Thinking Level · Medium	18	2025-08-07	未知
21	GPT-5.1 Thinking Level · High	17.6	2025-11-12	未知
22	Grok 4 Thinking Level · Medium	15.9	2025-07-10	未知
23	Claude Sonnet 4.5 Thinking Level · Medium	13.6	2025-09-30	未知
24	GPT-5 Thinking Level · High	9.9	2025-08-07	未知
25	GPT-5.2 Thinking Level · Low	9.7	2025-12-11	未知
26	Claude Opus 4 Normal	8.6	2025-05-23	未知
27	Claude Opus 4.5 Normal	7.8	2025-11-25	未知
28	GPT-5 Thinking Level · Medium	7.5	2025-08-07	未知
29	OpenAI o3 Thinking Level · Medium	6.5	2025-04-16	未知

滚动或悬停加载剩余 12 条

ARC-AGI-2 Model Score Leaderboard

Latest ARC-AGI-2 model rankings and full benchmark leaderboard

ARC-AGI-2详细排名数据表格