DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench Verified、SWE-Bench Pro、LiveCodeBench、SWE-bench Multilingual 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

数据更新于 2026-04-22 21:51:17

截至 2026年4月,本页覆盖 SWE-bench Verified, LiveCodeBench, SWE-Bench Pro - Public, SWE-bench Multilingual 等评测基准,聚焦 大模型代码编程能力评测排行榜 方向的模型对比。

点击模型名称可进入详情页查看上下文长度、许可方式与 API 价格。数据口径说明见 数据方法论。

基准评测
SWE-bench VerifiedLiveCodeBenchSWE-Bench Pro - PublicSWE-bench Multilingual
更多评测
参数规模:全部3B及以下7B13B34B65B100B及以上
模型类型:全部推理大模型基座大模型指令优化/聊天优化大模型编程大模型
开源:全部开源闭源
模型发布时间截止:

大模型性能评测结果

数据来源:DataLearnerAI
排名模型参数(亿)开源情况
1
Kimi K2.6
80.2089.6058.6076.7010000B免费商用
2
Kimi K2.5
76.8085.0050.7073.0010000B免费商用
3
MiniMax M2.5
80.20—55.40—2290B免费商用
4
GLM-5
77.80———7440B免费商用
5
M2.1
74.80—32.60—2300B免费商用
6
Step 3.5 Flash
74.4086.40——1960B免费商用
7
GLM-4.7
73.8084.9040.60—3580B免费商用
8
DeepSeek V3.2
73.1083.3040.90—6710B免费商用
9
Kimi K2 Thinking
71.3083.10——10400B免费商用
10
MiniMax M2
69.4083.00——2300B免费商用
11
Kimi K2 0905
69.20—27.67—10000B免费商用
12
DeepSeek-V3.1 Terminus
68.4080.00——6710B免费商用
13
GLM-4.6
68.0084.50——3550B免费商用
14
DeepSeek V3.2-Exp
67.8074.10——6710B免费商用
15
Qwen3-Coder-480B-A35B
67.00———4800B免费商用
16
DeepSeek-V3.1
66.0074.80——6710B免费商用
17
GLM-4.5
64.2072.90——3550B免费商用
18
DeepSeek-R1-0528
57.6073.30——6710B免费商用
19
GLM-4.5-Air
57.6070.70——1060B免费商用
20
MiniMax-M1-80k
56.0065.00——4560B免费商用
21
MiniMax-M1-40k
55.6062.30——4560B免费商用
22
Kimi K2
51.8053.70——10000B免费商用
23
DeepSeek-R1
49.2065.90——6710B免费商用
24
DeepSeek-V3-0324
38.8049.20——6710B免费商用
25
Qwen3-235B-A22B
34.4070.70——2350B免费商用
26
Llama 4 Behemoth Instruct
—49.40——20000B免费商用
27
MiniMax-M2.7
——56.20—2290B不可商用
28
Llama 4 Maverick Instruct
—43.40——4000B免费商用
29
ERNIE-4.5-VL-424B-A47B-Base
—38.80——4240B免费商用
30
ERNIE-4.5-300B-A47B
—38.80——3000B免费商用
1
Kimi K2.6
10000B
SWE-bench Verified80.20
LiveCodeBench89.60
SWE-Bench Pro - Public58.60
SWE-bench Multilingual76.70
免费商用
2
Kimi K2.5
10000B
SWE-bench Verified76.80
LiveCodeBench85.00
SWE-Bench Pro - Public50.70
SWE-bench Multilingual73.00
免费商用
3
MiniMax M2.5
2290B
SWE-bench Verified80.20
LiveCodeBench—
SWE-Bench Pro - Public55.40
SWE-bench Multilingual—
免费商用
4
GLM-5
7440B
SWE-bench Verified77.80
LiveCodeBench—
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
5
M2.1
2300B
SWE-bench Verified74.80
LiveCodeBench—
SWE-Bench Pro - Public32.60
SWE-bench Multilingual—
免费商用
6
Step 3.5 Flash
1960B
SWE-bench Verified74.40
LiveCodeBench86.40
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
7
GLM-4.7
3580B
SWE-bench Verified73.80
LiveCodeBench84.90
SWE-Bench Pro - Public40.60
SWE-bench Multilingual—
免费商用
8
DeepSeek V3.2
6710B
SWE-bench Verified73.10
LiveCodeBench83.30
SWE-Bench Pro - Public40.90
SWE-bench Multilingual—
免费商用
9
Kimi K2 Thinking
10400B
SWE-bench Verified71.30
LiveCodeBench83.10
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
10
MiniMax M2
2300B
SWE-bench Verified69.40
LiveCodeBench83.00
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
11
Kimi K2 0905
10000B
SWE-bench Verified69.20
LiveCodeBench—
SWE-Bench Pro - Public27.67
SWE-bench Multilingual—
免费商用
12
DeepSeek-V3.1 Terminus
6710B
SWE-bench Verified68.40
LiveCodeBench80.00
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
13
GLM-4.6
3550B
SWE-bench Verified68.00
LiveCodeBench84.50
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
14
DeepSeek V3.2-Exp
6710B
SWE-bench Verified67.80
LiveCodeBench74.10
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
15
Qwen3-Coder-480B-A35B
4800B
SWE-bench Verified67.00
LiveCodeBench—
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
16
DeepSeek-V3.1
6710B
SWE-bench Verified66.00
LiveCodeBench74.80
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
17
GLM-4.5
3550B
SWE-bench Verified64.20
LiveCodeBench72.90
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
18
DeepSeek-R1-0528
6710B
SWE-bench Verified57.60
LiveCodeBench73.30
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
19
GLM-4.5-Air
1060B
SWE-bench Verified57.60
LiveCodeBench70.70
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
20
MiniMax-M1-80k
4560B
SWE-bench Verified56.00
LiveCodeBench65.00
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
21
MiniMax-M1-40k
4560B
SWE-bench Verified55.60
LiveCodeBench62.30
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
22
Kimi K2
10000B
SWE-bench Verified51.80
LiveCodeBench53.70
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
23
DeepSeek-R1
6710B
SWE-bench Verified49.20
LiveCodeBench65.90
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
24
DeepSeek-V3-0324
6710B
SWE-bench Verified38.80
LiveCodeBench49.20
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
25
Qwen3-235B-A22B
2350B
SWE-bench Verified34.40
LiveCodeBench70.70
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
26
Llama 4 Behemoth Instruct
20000B
SWE-bench Verified—
LiveCodeBench49.40
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
27
MiniMax-M2.7
2290B
SWE-bench Verified—
LiveCodeBench—
SWE-Bench Pro - Public56.20
SWE-bench Multilingual—
不可商用
28
Llama 4 Maverick Instruct
4000B
SWE-bench Verified—
LiveCodeBench43.40
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
29
ERNIE-4.5-VL-424B-A47B-Base
4240B
SWE-bench Verified—
LiveCodeBench38.80
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
30
ERNIE-4.5-300B-A47B
3000B
SWE-bench Verified—
LiveCodeBench38.80
SWE-Bench Pro - Public—
SWE-bench Multilingual—
免费商用
排序:
查看全部 37 个模型的 SWE-bench Multilingual 完整排名