大模型数学推理能力评测排行榜

本页面提供最新、最全面的大模型数学推理能力评测排行榜。我们通过 GSM8K、MATH、AIME 2025 等多个权威数学基准数据集,对包括 OpenAI 的 GPT-4o、Anthropic 的 Claude、阿里巴巴的 Qwen、DeepSeek-R1 等模型进行评测。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型数学推理能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/leaderboards/category/math

筛选条件

#
模型
AIME2025
AIME 2024
MATH-500
GSM8K
参数(亿)
开源情况
1
OpenAI Logo
GPT-5 thinking + 使用工具
99.60
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 99.60
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
2
OpenAI Logo
OpenAI o4 - mini thinking + 使用工具
99.50
98.70
未公布
未公布
未知
不开源
AIME2025 (数学推理) 99.50
AIME 2024 (数学推理) 98.70
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
3
Google Deep Mind Logo
Gemini 2.5 Deep Think deeper_thinking
99.20
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 99.20
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
4
OpenAI Logo
GPT OSS 20B thinking + 使用工具
98.70
96.00
未公布
未公布
210
免费商用授权
AIME2025 (数学推理) 98.70
AIME 2024 (数学推理) 96.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 210
开源情况 免费商用授权
查看模型详情
5
OpenAI Logo
GPT OSS 120B thinking + 使用工具
97.90
96.60
未公布
未公布
117
免费商用授权
AIME2025 (数学推理) 97.90
AIME 2024 (数学推理) 96.60
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
6
OpenAI Logo
GPT-5-Pro thinking
96.70
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 96.70
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
7
OpenAI Logo
GPT-5 thinking
94.60
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 94.60
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
8
93.00
93.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 93.00
AIME 2024 (数学推理) 93.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
9
OpenAI Logo
OpenAI o4 - mini thinking
92.70
93.40
未公布
未公布
未知
不开源
AIME2025 (数学推理) 92.70
AIME 2024 (数学推理) 93.40
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
10
92.30
未公布
未公布
未公布
2,350
免费商用授权
AIME2025 (数学推理) 92.30
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
11
92.30
未公布
未公布
未公布
305
免费商用授权
AIME2025 (数学推理) 92.30
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
12
xAI Logo
Grok 4 thinking
91.70
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 91.70
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
13
OpenAI Logo
OpenAI o3 thinking
88.90
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 88.90
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
14
Google Deep Mind Logo
Gemini-2.5-Pro thinking
88.00
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 88.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
15
87.50
91.40
98.00
未公布
6,710
免费商用授权
AIME2025 (数学推理) 87.50
AIME 2024 (数学推理) 91.40
MATH-500 (数学推理) 98.00
GSM8K (数学推理) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
16
86.90
92.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 86.90
AIME 2024 (数学推理) 92.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
17
OpenAI Logo
OpenAI o3-mini thinking
86.50
60.00
95.80
未公布
未知
不开源
AIME2025 (数学推理) 86.50
AIME 2024 (数学推理) 60.00
MATH-500 (数学推理) 95.80
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
18
86.00
未公布
未公布
未公布
2,410
免费商用授权
AIME2025 (数学推理) 86.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 2,410
开源情况 免费商用授权
查看模型详情
19
83.00
92.00
98.80
未公布
未知
不开源
AIME2025 (数学推理) 83.00
AIME 2024 (数学推理) 92.00
MATH-500 (数学推理) 98.80
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
20
OpenAI Logo
GPT OSS 120B thinking
83.00
未公布
未公布
未公布
117
免费商用授权
AIME2025 (数学推理) 83.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 117
开源情况 免费商用授权
查看模型详情
21
82.90
未公布
未公布
未公布
3,210
免费商用授权
AIME2025 (数学推理) 82.90
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 3,210
开源情况 免费商用授权
查看模型详情
22
阿里巴巴 Logo
Qwen3-235B-A22B thinking
81.50
85.70
98.00
未公布
2,350
免费商用授权
AIME2025 (数学推理) 81.50
AIME 2024 (数学推理) 85.70
MATH-500 (数学推理) 98.00
GSM8K (数学推理) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
23
81.30
未公布
未公布
未公布
40
免费商用授权
AIME2025 (数学推理) 81.30
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
24
OpenAI Logo
GPT OSS 20B thinking
79.00
未公布
未公布
未公布
210
免费商用授权
AIME2025 (数学推理) 79.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 210
开源情况 免费商用授权
查看模型详情
25
Anthropic Logo
Claude Opus 4.1 thinking + 使用工具
78.00
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 78.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
26
77.10
84.20
未公布
未公布
未知
不开源
AIME2025 (数学推理) 77.10
AIME 2024 (数学推理) 84.20
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
27
76.90
86.00
96.80
未公布
4,560
免费商用授权
AIME2025 (数学推理) 76.90
AIME 2024 (数学推理) 86.00
MATH-500 (数学推理) 96.80
GSM8K (数学推理) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
28
76.80
87.30
未公布
91.83
800
免费商用授权
AIME2025 (数学推理) 76.80
AIME 2024 (数学推理) 87.30
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 91.83
参数(亿) 800
开源情况 免费商用授权
查看模型详情
29
75.50
76.00
98.20
未公布
未知
不开源
AIME2025 (数学推理) 75.50
AIME 2024 (数学推理) 76.00
MATH-500 (数学推理) 98.20
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
30
75.30
81.10
93.70
未公布
70
免费商用授权
AIME2025 (数学推理) 75.30
AIME 2024 (数学推理) 81.10
MATH-500 (数学推理) 93.70
GSM8K (数学推理) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
31
74.60
83.30
96.00
未公布
4,560
免费商用授权
AIME2025 (数学推理) 74.60
AIME 2024 (数学推理) 83.30
MATH-500 (数学推理) 96.00
GSM8K (数学推理) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
32
72.90
81.40
未公布
未公布
320
免费商用授权
AIME2025 (数学推理) 72.90
AIME 2024 (数学推理) 81.40
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
33
阿里巴巴 Logo
Qwen3-32B thinking
72.90
81.40
97.20
未公布
320
免费商用授权
AIME2025 (数学推理) 72.90
AIME 2024 (数学推理) 81.40
MATH-500 (数学推理) 97.20
GSM8K (数学推理) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
34
70.50
43.40
未公布
未公布
未知
不开源
AIME2025 (数学推理) 70.50
AIME 2024 (数学推理) 43.40
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
35
70.30
未公布
未公布
未公布
2,350
免费商用授权
AIME2025 (数学推理) 70.30
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
36
70.00
79.80
97.30
未公布
6,710
免费商用授权
AIME2025 (数学推理) 70.00
AIME 2024 (数学推理) 79.80
MATH-500 (数学推理) 97.30
GSM8K (数学推理) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
37
68.10
79.20
96.80
未公布
719
免费商用授权
AIME2025 (数学推理) 68.10
AIME 2024 (数学推理) 79.20
MATH-500 (数学推理) 96.80
GSM8K (数学推理) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
38
阿里巴巴 Logo
Qwen3-8B thinking
67.30
76.00
97.40
未公布
80
免费商用授权
AIME2025 (数学推理) 67.30
AIME 2024 (数学推理) 76.00
MATH-500 (数学推理) 97.40
GSM8K (数学推理) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
39
64.95
73.59
未公布
未公布
未知
不开源
AIME2025 (数学推理) 64.95
AIME 2024 (数学推理) 73.59
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
40
63.10
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 63.10
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
41
62.76
70.68
未公布
未公布
240
免费商用授权
AIME2025 (数学推理) 62.76
AIME 2024 (数学推理) 70.68
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
42
61.90
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 61.90
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
43
61.30
未公布
未公布
未公布
305
免费商用授权
AIME2025 (数学推理) 61.30
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
44
54.80
23.30
82.20
未公布
未知
不开源
AIME2025 (数学推理) 54.80
AIME 2024 (数学推理) 23.30
MATH-500 (数学推理) 82.20
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
45
54.00
69.60
97.40
未公布
10,000
免费商用授权
AIME2025 (数学推理) 54.00
AIME 2024 (数学推理) 69.60
MATH-500 (数学推理) 97.40
GSM8K (数学推理) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
46
47.70
59.40
94.00
96.30
6,810
免费商用授权
AIME2025 (数学推理) 47.70
AIME 2024 (数学推理) 59.40
MATH-500 (数学推理) 94.00
GSM8K (数学推理) 96.30
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
47
47.40
未公布
未公布
未公布
40
免费商用授权
AIME2025 (数学推理) 47.40
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 40
开源情况 免费商用授权
查看模型详情
48
46.60
88.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 46.60
AIME 2024 (数学推理) 88.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
49
OpenAI Logo
GPT-4o normal + 使用工具
42.10
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 42.10
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
50
36.70
48.10
92.80
95.90
未知
不开源
AIME2025 (数学推理) 36.70
AIME 2024 (数学推理) 48.10
MATH-500 (数学推理) 92.80
GSM8K (数学推理) 95.90
参数(亿) 未知
开源情况 不开源
查看模型详情
51
35.10
54.80
96.40
96.60
3,000
免费商用授权
AIME2025 (数学推理) 35.10
AIME 2024 (数学推理) 54.80
MATH-500 (数学推理) 96.40
GSM8K (数学推理) 96.60
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
52
35.10
未公布
未公布
未公布
4,240
免费商用授权
AIME2025 (数学推理) 35.10
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 4,240
开源情况 免费商用授权
查看模型详情
53
29.70
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 29.70
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
54
26.70
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 26.70
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
55
24.70
85.70
96.20
96.40
2,350
免费商用授权
AIME2025 (数学推理) 24.70
AIME 2024 (数学推理) 85.70
MATH-500 (数学推理) 96.20
GSM8K (数学推理) 96.40
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
56
21.60
未公布
未公布
未公布
305
免费商用授权
AIME2025 (数学推理) 21.60
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 305
开源情况 免费商用授权
查看模型详情
57
20.90
79.40
87.40
未公布
80
免费商用授权
AIME2025 (数学推理) 20.90
AIME 2024 (数学推理) 79.40
MATH-500 (数学推理) 87.40
GSM8K (数学推理) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
58
100.00
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 100.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
59
OpenAI Logo
GPT-5-Pro thinking + 使用工具
100.00
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 100.00
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
60
未公布
80.00
96.20
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 80.00
MATH-500 (数学推理) 96.20
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
61
未公布
未公布
未公布
36.20
70
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 36.20
参数(亿) 70
开源情况 免费商用授权
查看模型详情
62
未公布
39.00
87.80
未公布
6,810
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 39.00
MATH-500 (数学推理) 87.80
GSM8K (数学推理) 未公布
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
63
未公布
未公布
未公布
55.30
80
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 55.30
参数(亿) 80
开源情况 免费商用授权
查看模型详情
64
未公布
40.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 40.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
65
未公布
未公布
未公布
70.70
90
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 70.70
参数(亿) 90
开源情况 免费商用授权
查看模型详情
66
未公布
36.70
90.70
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 36.70
MATH-500 (数学推理) 90.70
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
67
未公布
未公布
未公布
85.40
70
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 85.40
参数(亿) 70
开源情况 免费商用授权
查看模型详情
68
未公布
未公布
未公布
77.40
160
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 77.40
参数(亿) 160
开源情况 免费商用授权
查看模型详情
69
未公布
96.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 96.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
70
未公布
36.00
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 36.00
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
71
未公布
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
72
未公布
9.30
75.90
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 9.30
MATH-500 (数学推理) 75.90
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
73
未公布
未公布
94.50
未公布
700
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 94.50
GSM8K (数学推理) 未公布
参数(亿) 700
开源情况 免费商用授权
查看模型详情
74
未公布
92.00
98.80
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 92.00
MATH-500 (数学推理) 98.80
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
75
未公布
未公布
96.20
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 96.20
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
76
未公布
91.60
98.10
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 91.60
MATH-500 (数学推理) 98.10
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
77
未公布
未公布
94.60
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 94.60
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
78
未公布
未公布
未公布
95.00
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 95.00
参数(亿) 未知
开源情况 不开源
查看模型详情
79
未公布
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
80
未公布
未公布
未公布
95.90
320
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 95.90
参数(亿) 320
开源情况 免费商用授权
查看模型详情
81
未公布
未公布
未公布
未公布
4,050
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
82
未公布
49.60
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 49.60
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
83
未公布
29.40
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 29.40
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
84
未公布
未公布
95.00
未公布
20,000
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 95.00
GSM8K (数学推理) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
85
未公布
93.30
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 93.30
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
86
未公布
78.20
96.20
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 78.20
MATH-500 (数学推理) 96.20
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
87
未公布
81.90
92.40
95.98
70
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 81.90
MATH-500 (数学推理) 92.40
GSM8K (数学推理) 95.98
参数(亿) 70
开源情况 免费商用授权
查看模型详情
88
未公布
76.40
未公布
未公布
90
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 76.40
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
89
未公布
未公布
未公布
91.30
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 91.30
参数(亿) 未知
开源情况 不开源
查看模型详情
90
未公布
25.30
未公布
未公布
270
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 25.30
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 270
开源情况 免费商用授权
查看模型详情
91
未公布
16.00
78.00
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 16.00
MATH-500 (数学推理) 78.00
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
92
未公布
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
93
未公布
未公布
未公布
91.50
727
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 91.50
参数(亿) 727
开源情况 免费商用授权
查看模型详情
94
未公布
79.50
91.00
未公布
325
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 79.50
MATH-500 (数学推理) 91.00
GSM8K (数学推理) 未公布
参数(亿) 325
开源情况 免费商用授权
查看模型详情
95
未公布
10.00
71.80
88.60
38
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 10.00
MATH-500 (数学推理) 71.80
GSM8K (数学推理) 88.60
参数(亿) 38
开源情况 免费商用授权
查看模型详情
96
未公布
87.00
97.90
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 87.00
MATH-500 (数学推理) 97.90
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
97
未公布
未公布
未公布
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
98
未公布
63.60
90.00
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 63.60
MATH-500 (数学推理) 90.00
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
99
未公布
79.20
96.40
未公布
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 79.20
MATH-500 (数学推理) 96.40
GSM8K (数学推理) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
100
智谱AI Logo
GLM-4.5-Air thinking
未公布
89.40
98.10
未公布
1,060
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 89.40
MATH-500 (数学推理) 98.10
GSM8K (数学推理) 未公布
参数(亿) 1,060
开源情况 免费商用授权
查看模型详情
101
智谱AI Logo
GLM-4.5 thinking
未公布
91.00
98.20
未公布
3,550
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 91.00
MATH-500 (数学推理) 98.20
GSM8K (数学推理) 未公布
参数(亿) 3,550
开源情况 免费商用授权
查看模型详情
102
未公布
50.00
90.60
未公布
320
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 50.00
MATH-500 (数学推理) 90.60
GSM8K (数学推理) 未公布
参数(亿) 320
开源情况 免费商用授权
查看模型详情
103
未公布
未公布
未公布
94.50
未知
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 94.50
参数(亿) 未知
开源情况 不开源
查看模型详情
104
未公布
53.30
91.40
未公布
70
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 53.30
MATH-500 (数学推理) 91.40
GSM8K (数学推理) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
105
未公布
50.00
90.40
未公布
38
不开源
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 50.00
MATH-500 (数学推理) 90.40
GSM8K (数学推理) 未公布
参数(亿) 38
开源情况 不开源
查看模型详情
106
未公布
未公布
未公布
82.40
80
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 82.40
参数(亿) 80
开源情况 免费商用授权
查看模型详情
107
未公布
未公布
未公布
79.10
30
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 79.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
108
未公布
未公布
未公布
34.00
32
免费商用授权
AIME2025 (数学推理) 未公布
AIME 2024 (数学推理) 未公布
MATH-500 (数学推理) 未公布
GSM8K (数学推理) 34.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情