AIME 2026

Name: American Invitational Mathematics Examination 2026
Creator: 个人

AIME 2026 是基于美国数学邀请赛（American Invitational Mathematics Examination）2026 年问题的评测基准，用于评估大语言模型在高中水平数学推理方面的表现。该基准包含 15 个问题，覆盖代数、几何、数论和组合数学等领域。模型通过生成答案并与标准答案比较来计算准确率。

更新于 2026年6月20日·2,797 次浏览

问题数量: 15
发布机构: 个人
评测类别: 数学推理
评测指标: Accuracy
支持语言: 英文
难度等级: 高难度

简介

基于2026年美国数学邀请赛的大模型数学推理能力评测基准

AIME 2026评测最新大模型排名与完整榜单数据

查看 AIME 2026 的最新得分、模型模式、发布时间与参数规模，快速了解当前完整榜单表现。

数据来源：DataLearnerAI

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型模式说明

许可证:

来源:

模型发布时间截止:

排名	模型				开源情况
	GLM-5.2 开启思考	99.20	2026-06-13	7533.3亿	免费商用
	Kimi K2.6 开启思考	96.40	2026-04-20	10000亿	免费商用
	GLM 5.1 开启思考	95.30	2026-03-27	754亿	免费商用
4	Qwen 3.6 Plus Preview 开启思考	95.30	2026-03-31	未知	闭源
5	Qwen3.6-27B 开启思考	94.10	2026-04-22	270亿	免费商用
6	Opus 4.5 扩展思考	93.30	2025-11-25	未知	闭源
7	GLM-4.7 开启思考	92.90	2025-12-22	3580亿	免费商用
8	DeepSeek V3.2 开启思考	92.70	2025-12-01	6710亿	免费商用
9	GLM-5 开启思考	92.70	2026-02-11	7440亿	免费商用
10	Qwen3.6-35B-A3B 开启思考	92.70	2026-04-16	350亿	免费商用
11	Kimi K2.5 开启思考	92.50	2026-01-27	10000亿	免费商用
12	Qwen3.5-397B-A17B 开启思考	91.30	2026-02-16	397亿	免费商用
13	Gemini 3.0 Pro (Preview 11-2025) 开启思考	90.60	2025-11-18	未知	闭源
14	Gemma 4 31B 开启思考	89.20	2026-04-02	31亿	免费商用
15	Gemma 4 26B A4B 开启思考	88.30	2026-04	25.2亿	免费商用

AIME 2026评测最新大模型排名与完整榜单数据

AIME 2026 排名