DROP评测基准：大模型排名与测试结果 | DataLearnerAI

DROP

更新于 2026年4月3日·1,207 次浏览

问题数量: 96000
发布机构: Allen Institute for AI
评测类别: 阅读理解
评测指标: F1
支持语言: 英语
难度等级: Advanced

简介

一个需要模型进行离散推理的阅读理解基准，包括计数、比较和排序等操作。

相关资源

DROP评测最新大模型排名与完整榜单数据

查看 DROP 的最新得分、模型模式、发布时间与参数规模，快速了解当前完整榜单表现。

数据来源：DataLearnerAI

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型模式说明

许可证:

来源:

模型发布时间截止:

排名	模型				开源情况
	Pangu Pro MoE 常规模式	91.20	2025-06-30	719亿	免费商用
	ERNIE-4.5-300B-A47B 常规模式	91.10	2025-06-30	3000亿	免费商用
	DeepSeek-V3-0324 常规模式	89.70	2025-03-24	6710亿	免费商用
4	GPT-4.1 常规模式	89.20	2025-04-14	未知	闭源
5	Qwen3-235B-A22B 常规模式	88.70	2025-04-28	2350亿	免费商用
6	Claude3-Opus 常规模式	83.10	2024-03-04	未知	闭源
7	GPT-4 常规模式	80.90	2023-03-14	1750亿	闭源
8	Gemma 3 - 27B (IT) 常规模式	77.20	2025-03-12	270亿	免费商用
9	Gemma2-27B 常规模式	74.20	2024-05-14	270亿	免费商用