大模型代码编程能力评测排行榜

本页面提供最新、最全面的大模型代码编程能力评测排行榜。 我们通过 SWE-Bench、LiveCodeBench、HumanEval 等多个权威编程基准数据集,对包括 OpenAI 的 GPT-4o、Anthropic 的 Claude 4 Opus、阿里巴巴的 Qwen3、DeepSeek-Coder 等在内的全球领先大模型进行深度评测。

在这里,您可以直观地对比各大模型在 代码生成、代码理解、算法实现、Bug 修复、代码补全 等方面的真实表现。自由选择您关注的模型和评测基准,一键生成对比图表,为您的 软件开发、AI 编程助手选型 和学术研究提供精准、可靠的数据支持。

所有评测基准的详细介绍可见: LLM 评测基准列表与介绍

大模型代码编程能力评测排行榜

数据来源:DataLearnerAI

数据地址:https://www.datalearner.com/ai-benchmarks/software-engineer-leaderboard

筛选条件

#
模型
SWE-bench Verified
LiveCodeBench
HumanEval
参数(亿)
开源情况
1
75.00
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 75.00
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
2
75.00
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 75.00
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
3
73.50
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 73.50
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
4
72.70
48.50
未公布
未知
不开源
SWE-bench Verified (代码生成) 72.70
LiveCodeBench (代码生成) 48.50
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
5
72.50
56.60
未公布
未知
不开源
SWE-bench Verified (代码生成) 72.50
LiveCodeBench (代码生成) 56.60
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
6
72.00
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 72.00
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
7
70.30
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 70.30
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
8
69.10
75.80
未公布
未知
不开源
SWE-bench Verified (代码生成) 69.10
LiveCodeBench (代码生成) 75.80
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
9
68.10
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 68.10
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
10
63.80
70.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 63.80
LiveCodeBench (代码生成) 70.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
11
63.80
63.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 63.80
LiveCodeBench (代码生成) 63.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
12
63.20
77.10
未公布
未知
不开源
SWE-bench Verified (代码生成) 63.20
LiveCodeBench (代码生成) 77.10
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
13
61.60
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 61.60
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
14
59.60
77.10
未公布
未知
不开源
SWE-bench Verified (代码生成) 59.60
LiveCodeBench (代码生成) 77.10
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
15
57.60
73.30
未公布
6,850
免费商用授权
SWE-bench Verified (代码生成) 57.60
LiveCodeBench (代码生成) 73.30
HumanEval (代码生成) 未公布
参数(亿) 6,850
开源情况 免费商用授权
查看模型详情
16
56.00
65.00
未公布
4,560
免费商用授权
SWE-bench Verified (代码生成) 56.00
LiveCodeBench (代码生成) 65.00
HumanEval (代码生成) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
17
55.60
62.30
未公布
4,560
免费商用授权
SWE-bench Verified (代码生成) 55.60
LiveCodeBench (代码生成) 62.30
HumanEval (代码生成) 未公布
参数(亿) 4,560
开源情况 免费商用授权
查看模型详情
18
54.60
40.50
未公布
未知
不开源
SWE-bench Verified (代码生成) 54.60
LiveCodeBench (代码生成) 40.50
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
19
53.60
未公布
未公布
240
免费商用授权
SWE-bench Verified (代码生成) 53.60
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
20
51.80
53.70
未公布
10,000
免费商用授权
SWE-bench Verified (代码生成) 51.80
LiveCodeBench (代码生成) 53.70
HumanEval (代码生成) 未公布
参数(亿) 10,000
开源情况 免费商用授权
查看模型详情
21
49.30
69.50
97.60
未知
不开源
SWE-bench Verified (代码生成) 49.30
LiveCodeBench (代码生成) 69.50
HumanEval (代码生成) 97.60
参数(亿) 未知
开源情况 不开源
查看模型详情
22
49.20
65.90
未公布
6,710
免费商用授权
SWE-bench Verified (代码生成) 49.20
LiveCodeBench (代码生成) 65.90
HumanEval (代码生成) 未公布
参数(亿) 6,710
开源情况 免费商用授权
查看模型详情
23
49.00
38.70
93.70
未知
不开源
SWE-bench Verified (代码生成) 49.00
LiveCodeBench (代码生成) 38.70
HumanEval (代码生成) 93.70
参数(亿) 未知
开源情况 不开源
查看模型详情
24
48.90
71.00
未公布
未知
不开源
SWE-bench Verified (代码生成) 48.90
LiveCodeBench (代码生成) 71.00
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
25
46.80
未公布
未公布
240
免费商用授权
SWE-bench Verified (代码生成) 46.80
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
26
38.80
49.20
未公布
6,810
免费商用授权
SWE-bench Verified (代码生成) 38.80
LiveCodeBench (代码生成) 49.20
HumanEval (代码生成) 未公布
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
27
38.00
46.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 38.00
LiveCodeBench (代码生成) 46.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
28
34.40
70.70
未公布
2,350
免费商用授权
SWE-bench Verified (代码生成) 34.40
LiveCodeBench (代码生成) 70.70
HumanEval (代码生成) 未公布
参数(亿) 2,350
开源情况 免费商用授权
查看模型详情
29
31.00
35.10
90.00
未知
不开源
SWE-bench Verified (代码生成) 31.00
LiveCodeBench (代码生成) 35.10
HumanEval (代码生成) 90.00
参数(亿) 未知
开源情况 不开源
查看模型详情
30
27.60
34.30
未公布
未知
不开源
SWE-bench Verified (代码生成) 27.60
LiveCodeBench (代码生成) 34.30
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
31
23.60
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 23.60
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
32
21.40
29.10
未公布
未知
不开源
SWE-bench Verified (代码生成) 21.40
LiveCodeBench (代码生成) 29.10
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
33
未公布
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
34
未公布
未公布
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
35
未公布
37.90
86.60
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 37.90
HumanEval (代码生成) 86.60
参数(亿) 未知
开源情况 不开源
查看模型详情
36
未公布
80.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 80.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
37
未公布
70.60
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 70.60
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
38
未公布
31.50
81.10
220
不可以商用
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 31.50
HumanEval (代码生成) 81.10
参数(亿) 220
开源情况 不可以商用
查看模型详情
39
未公布
28.90
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 28.90
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
40
未公布
63.90
未公布
800
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 63.90
HumanEval (代码生成) 未公布
参数(亿) 800
开源情况 免费商用授权
查看模型详情
41
未公布
38.80
未公布
3,000
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 38.80
HumanEval (代码生成) 未公布
参数(亿) 3,000
开源情况 免费商用授权
查看模型详情
42
未公布
59.60
未公布
719
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 59.60
HumanEval (代码生成) 未公布
参数(亿) 719
开源情况 免费商用授权
查看模型详情
43
未公布
67.10
未公布
70
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 67.10
HumanEval (代码生成) 未公布
参数(亿) 70
开源情况 免费商用授权
查看模型详情
44
未公布
61.80
未公布
80
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 61.80
HumanEval (代码生成) 未公布
参数(亿) 80
开源情况 免费商用授权
查看模型详情
45
未公布
51.80
未公布
90
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 51.80
HumanEval (代码生成) 未公布
参数(亿) 90
开源情况 免费商用授权
查看模型详情
46
未公布
65.70
未公布
220
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 65.70
HumanEval (代码生成) 未公布
参数(亿) 220
开源情况 免费商用授权
查看模型详情
47
未公布
29.70
87.80
270
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 29.70
HumanEval (代码生成) 87.80
参数(亿) 270
开源情况 免费商用授权
查看模型详情
48
未公布
34.60
89.00
6,810
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 34.60
HumanEval (代码生成) 89.00
参数(亿) 6,810
开源情况 免费商用授权
查看模型详情
49
未公布
82.00
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 82.00
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
50
未公布
未公布
33.50
80
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 33.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
51
未公布
65.90
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 65.90
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
52
未公布
73.80
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 73.80
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
53
未公布
67.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 67.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
54
未公布
未公布
73.20
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 73.20
参数(亿) 未知
开源情况 不开源
查看模型详情
55
未公布
未公布
66.50
80
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 66.50
参数(亿) 80
开源情况 免费商用授权
查看模型详情
56
未公布
未公布
42.10
30
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 42.10
参数(亿) 30
开源情况 免费商用授权
查看模型详情
57
未公布
未公布
28.00
32
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 28.00
参数(亿) 32
开源情况 免费商用授权
查看模型详情
58
未公布
未公布
74.40
38
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 74.40
参数(亿) 38
开源情况 免费商用授权
查看模型详情
59
未公布
未公布
29.30
70
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 29.30
参数(亿) 70
开源情况 免费商用授权
查看模型详情
60
未公布
未公布
37.80
90
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 37.80
参数(亿) 90
开源情况 免费商用授权
查看模型详情
61
未公布
65.60
未公布
未知
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 65.60
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 免费商用授权
查看模型详情
62
未公布
未公布
57.90
70
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 57.90
参数(亿) 70
开源情况 免费商用授权
查看模型详情
63
未公布
未公布
48.10
160
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 48.10
参数(亿) 160
开源情况 免费商用授权
查看模型详情
64
未公布
未公布
74.10
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 74.10
参数(亿) 未知
开源情况 不开源
查看模型详情
65
未公布
未公布
88.40
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 88.40
参数(亿) 未知
开源情况 不开源
查看模型详情
66
未公布
未公布
84.90
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 84.90
参数(亿) 未知
开源情况 不开源
查看模型详情
67
未公布
未公布
89.00
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
68
未公布
未公布
89.00
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 89.00
参数(亿) 未知
开源情况 不开源
查看模型详情
69
未公布
未公布
59.10
727
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 59.10
参数(亿) 727
开源情况 免费商用授权
查看模型详情
70
未公布
未公布
90.20
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 90.20
参数(亿) 未知
开源情况 不开源
查看模型详情
71
未公布
64.90
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 64.90
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
72
未公布
55.84
未公布
240
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 55.84
HumanEval (代码生成) 未公布
参数(亿) 240
开源情况 免费商用授权
查看模型详情
73
未公布
未公布
92.00
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 92.00
参数(亿) 未知
开源情况 不开源
查看模型详情
74
未公布
51.20
88.40
320
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 51.20
HumanEval (代码生成) 88.40
参数(亿) 320
开源情况 免费商用授权
查看模型详情
75
未公布
49.40
未公布
20,000
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 49.40
HumanEval (代码生成) 未公布
参数(亿) 20,000
开源情况 免费商用授权
查看模型详情
76
未公布
33.30
80.50
700
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 33.30
HumanEval (代码生成) 80.50
参数(亿) 700
开源情况 免费商用授权
查看模型详情
77
未公布
33.30
88.40
700
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 33.30
HumanEval (代码生成) 88.40
参数(亿) 700
开源情况 免费商用授权
查看模型详情
78
未公布
43.40
未公布
4,000
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 43.40
HumanEval (代码生成) 未公布
参数(亿) 4,000
开源情况 免费商用授权
查看模型详情
79
未公布
32.80
未公布
1,090
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 32.80
HumanEval (代码生成) 未公布
参数(亿) 1,090
开源情况 免费商用授权
查看模型详情
80
未公布
79.40
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 79.40
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
81
未公布
59.36
未公布
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 59.36
HumanEval (代码生成) 未公布
参数(亿) 未知
开源情况 不开源
查看模型详情
82
未公布
未公布
62.20
320
不可以商用
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 62.20
参数(亿) 320
开源情况 不可以商用
查看模型详情
83
未公布
未公布
88.10
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 88.10
参数(亿) 未知
开源情况 不开源
查看模型详情
84
未公布
未公布
87.20
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 87.20
参数(亿) 未知
开源情况 不开源
查看模型详情
85
未公布
未公布
88.41
240
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 88.41
参数(亿) 240
开源情况 免费商用授权
查看模型详情
86
未公布
24.60
未公布
120
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 24.60
HumanEval (代码生成) 未公布
参数(亿) 120
开源情况 免费商用授权
查看模型详情
87
未公布
未公布
19.00
325
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 未公布
HumanEval (代码生成) 19.00
参数(亿) 325
开源情况 免费商用授权
查看模型详情
88
未公布
30.20
89.00
4,050
免费商用授权
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 30.20
HumanEval (代码生成) 89.00
参数(亿) 4,050
开源情况 免费商用授权
查看模型详情
89
未公布
32.00
91.00
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 32.00
HumanEval (代码生成) 91.00
参数(亿) 未知
开源情况 不开源
查看模型详情
90
未公布
52.00
92.40
未知
不开源
SWE-bench Verified (代码生成) 未公布
LiveCodeBench (代码生成) 52.00
HumanEval (代码生成) 92.40
参数(亿) 未知
开源情况 不开源
查看模型详情