DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Back to benchmark list
  2. /
  3. ARC-AGI

ARC-AGI 评测基准详情

更新2026-03-09
Views1,083
问题数量
100
发布机构
个人
评测类别
综合评估
评测指标
—
支持语言
英文
难度等级
—

简介

Keras创始人创建的通用人工智能评测系统

相关资源

查看原始论文
阅读学术论文原文
获取数据集
下载评测数据集
访问官网
浏览项目官方网站

ARC-AGI Model Score Leaderboard

Source: DataLearnerAI

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

模式说明:
normal
thinking
low
medium
high
deeper thinking
parallel_thinking
图表加载中...

详细评测数据

No parallel thinking results available

ARC-AGI详细排名数据表格

排名模型
1
Gemini 3 Deep Think - 2620default
962026-02-13未知
2
GPT-5.4 Pro思考模式 High(无工具)
94.52026-03-05未知
3
Claude Opus 4.6default
942026-02-05未知
4
Claude Opus 4.6思考模式 High(无工具)
942026-02-05未知
5
GPT-5.4常规模式(无工具)
93.72026-03-05未知
6
GPT-5.4极高强度思考(无工具)
93.72026-03-05未知
7
Claude Opus 4.6default
922026-02-05未知
8
GPT-5.2 Prodefault
90.52025-12-11未知
9
Gemini 3.0 Pro (Preview 11-2025)default
87.52025-11-18未知
10
GPT-5.2default
86.22025-12-11未知
11
GPT-5.2思考模式(无工具)
86.22025-12-11未知
12
GPT-5.2极高强度思考(无工具)
86.22025-12-11未知
13
GPT-5.4思考模式 Medium(无工具)
86.22026-03-05未知
14
Claude Opus 4.6default
862026-02-05未知
15
Claude Opus 4.5default
802025-11-25未知
16
Gemini 3.0 Pro (Preview 11-2025)default
752025-11-18未知
17
GPT-5.1default
72.82025-11-12未知
18
GPT-5-Prodefault
70.22025-08-07未知
19
GPT-5.4思考模式 Low(无工具)
68.22026-03-05未知
20
Grok 4default
66.72025-07-10未知
21
GPT-5default
65.72025-08-07未知
22
Claude Sonnet 4.5default
63.72025-09-30未知
23
OpenAI o3default
60.82025-04-16未知
24
o3-prodefault
59.32025-06-10未知
25
OpenAI o4 - minidefault
58.72025-04-16未知
26
GPT-5.1default
57.72025-11-12未知
27
Step 3.5 Flashdefault
56.52026-02-021960
28
GPT-5default
56.22025-08-07未知
29
Step 3.5 Flashdefault
53.52026-02-021960
30
Haiku 4.5default
47.72025-10-15未知
将鼠标移至此处继续加载剩余 20 条