DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
工具
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

数据更新于: 2025/10/12 20:54:51
SWE-bench VerifiedLiveCodeBenchHumanEval
更多评测
参数规模:全部3B及以下7B13B34B65B100B及以上
模型类型:全部推理大模型基座大模型指令优化/聊天优化大模型编程大模型

大模型性能评测结果

数据来源:DataLearnerAI
排名模型SWE-bench VerifiedLiveCodeBenchHumanEval参数(亿)开源情况
1Qwen3.5-397B-A17B76.4083.600.00397B免费商用
2Qwen3.5-27B
72.40
80.70
0.00
270B
免费商用
3GLM-4.7-Flash59.200.000.00310B免费商用
4Devstral Small 1.153.600.000.00240B免费商用
5Qwen3-Coder-Flash51.600.000.00305B免费商用
6Devstral Small 1.046.800.000.00240B免费商用
7GPT OSS 20B34.000.000.00210B免费商用
8Qwen3-30B-A3B-250722.0043.200.00305B免费商用
9Qwen3-30B-A3B0.0029.000.00305B免费商用
10Mistral-Small-3.1-24B-Instruct-25030.000.0088.41240B免费商用
11Magistral-Small-25060.0055.840.00240B免费商用
12Qwen3-32B0.0065.700.00320B免费商用
13Qwen3-235B-A22B-Thinking0.0074.100.00305B免费商用
14Gemma 4 31B0.0080.000.00310B免费商用
15QwQ-32B0.000.0019.00325B免费商用
16Gemma2-27B0.000.0051.80270B免费商用
17C4AI Aya Vision 32B0.000.0062.20320B不可商用
18Codestral0.0031.5081.10220B不可商用
19Gemma 3 - 27B (IT)0.0029.7087.80270B免费商用
20Qwen2.5-32B0.0051.2088.40320B免费商用
1
Qwen3.5-397B-A17B
397B
SWE-bench Verified76.40
LiveCodeBench83.60
HumanEval0.00
免费商用
2
Qwen3.5-27B
270B
SWE-bench Verified72.40
LiveCodeBench80.70
HumanEval0.00
免费商用
3
GLM-4.7-Flash
310B
SWE-bench Verified59.20
LiveCodeBench0.00
HumanEval0.00
免费商用
4
Devstral Small 1.1
240B
SWE-bench Verified53.60
LiveCodeBench0.00
HumanEval0.00
免费商用
5
Qwen3-Coder-Flash
305B
SWE-bench Verified51.60
LiveCodeBench0.00
HumanEval0.00
免费商用
6
Devstral Small 1.0
240B
SWE-bench Verified46.80
LiveCodeBench0.00
HumanEval0.00
免费商用
7
GPT OSS 20B
210B
SWE-bench Verified34.00
LiveCodeBench0.00
HumanEval0.00
免费商用
8
Qwen3-30B-A3B-2507
305B
SWE-bench Verified22.00
LiveCodeBench43.20
HumanEval0.00
免费商用
9
Qwen3-30B-A3B
305B
SWE-bench Verified0.00
LiveCodeBench29.00
HumanEval0.00
免费商用
10
Mistral-Small-3.1-24B-Instruct-2503
240B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval88.41
免费商用
11
Magistral-Small-2506
240B
SWE-bench Verified0.00
LiveCodeBench55.84
HumanEval0.00
免费商用
12
Qwen3-32B
320B
SWE-bench Verified0.00
LiveCodeBench65.70
HumanEval0.00
免费商用
13
Qwen3-235B-A22B-Thinking
305B
SWE-bench Verified0.00
LiveCodeBench74.10
HumanEval0.00
免费商用
14
Gemma 4 31B
310B
SWE-bench Verified0.00
LiveCodeBench80.00
HumanEval0.00
免费商用
15
QwQ-32B
325B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval19.00
免费商用
16
Gemma2-27B
270B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval51.80
免费商用
17
C4AI Aya Vision 32B
320B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval62.20
不可商用
18
Codestral
220B
SWE-bench Verified0.00
LiveCodeBench31.50
HumanEval81.10
不可商用
19
Gemma 3 - 27B (IT)
270B
SWE-bench Verified0.00
LiveCodeBench29.70
HumanEval87.80
免费商用
20
Qwen2.5-32B
320B
SWE-bench Verified0.00
LiveCodeBench51.20
HumanEval88.40
免费商用