ARC-AGI-3

Name: ARC-AGI-3
Creator: 个人

ARC-AGI 系列基准由 ARC Prize Foundation 维护，长期被主要 AI 实验室和学术研究者作为衡量 AI 推理能力的参照。2026年3月25日，该系列第三代版本 ARC-AGI-3 在旧金山 Y Combinator 正式发布，这是自2019年该系列初次推出以来，格式层面改动最大的一次迭代。

更新于 2026年5月29日·367 次浏览

问题数量: 135
发布机构: 个人
评测类别: 综合评估
评测指标: Accuracy
支持语言: 英文
难度等级: 高难度

简介

一个用于评估大模型智力的综合评测基准

ARC-AGI-3评测最新大模型排名与完整榜单数据

查看 ARC-AGI-3 的最新得分、模型模式、发布时间与参数规模，快速了解当前完整榜单表现。

数据来源：DataLearnerAI

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型模式说明

许可证:

来源:

模型发布时间截止:

排名	模型				开源情况
	Claude Opus 4.6 思考水平·Max	0.0045	2026-02-05	未知	闭源
	GPT-5.5 思考水平·高	0.0043	2026-04-23	未知	闭源
	Gemini 3.1 Pro Preview 思考水平·高	0.004	2026-02-20	未知	闭源
4	GPT-5.4 思考水平·高	0.002	2026-03-05	未知	闭源
5	Opus 4.7 思考水平·高	0.0018	2026-04-16	未知	闭源
6	Grok 4.2 开启思考	0.001	2026-02-17	未知	闭源

ARC-AGI-3评测最新大模型排名与完整榜单数据

ARC-AGI-3 排名