Discrete Reasoning over the content of Paragraphs
一个需要模型进行离散推理的阅读理解基准,包括计数、比较和排序等操作。
模型简称 | 得分 | 发布机构 | 发布时间 | 参数规模(亿) |
---|---|---|---|---|
Pangu Pro MoE | 91.2 |
![]() |
2025-06-30 | 719.0 |
ERNIE-4.5-300B-A47B | 91.1 |
![]() |
2025-06-30 | 3000.0 |
DeepSeek-V3-0324 | 89.7 |
![]() |
2025-03-24 | 6810.0 |
GPT-4.1 | 89.2 |
![]() |
2025-04-14 | 未知 |
Qwen3-235B-A22B | 88.7 |
![]() |
2025-04-28 | 2350.0 |
Claude3-Opus | 83.1 |
![]() |
2024-03-04 | 0.0 |