DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
工具
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

数据更新于: 2025/10/12 20:54:51
SWE-bench VerifiedLiveCodeBenchHumanEval
更多评测
参数规模:全部3B及以下7B13B34B65B100B及以上
模型类型:全部推理大模型基座大模型指令优化/聊天优化大模型编程大模型

大模型性能评测结果

数据来源:DataLearnerAI
排名模型SWE-bench VerifiedLiveCodeBenchHumanEval参数(亿)开源情况
1GPT-572.800.000.00—不开源
2Qwen2.5-7B
0.00
0.00
57.90
70B
免费商用
3Gemma 3 - 12B (IT)0.0024.600.00120B免费商用
4GPT-5-mini0.0055.000.00—不开源
5Hunyuan-A13B-Instruct0.0063.900.00800B免费商用
6Llama-3.2-3B0.000.0028.0032B免费商用
7Llama3.1-8B0.000.0033.5080B免费商用
8Gemma 2 - 9B0.000.0037.8090B免费商用
9Qwen2.5-3B0.000.0042.1030B免费商用
10Gemma2-27B0.000.0051.80270B免费商用
11Gemini 1.5 Pro0.000.0089.00—不开源
12Qwen2.5-72B0.000.0059.10727B免费商用
13GPT-40.000.0067.001750B不开源
14Llama3.1-70B-Instruct0.0033.3080.50700B免费商用
15GPT-4o mini0.000.0087.20—不开源
16Claude 3.5 Haiku0.000.0088.10—不开源
17Qwen2.5-32B0.0051.2088.40320B免费商用
18Mistral-Small-3.1-24B-Instruct-25030.000.0088.41240B免费商用
19Llama3.1-405B Instruct0.0030.2089.004050B免费商用
1
GPT-5
SWE-bench Verified72.80
LiveCodeBench0.00
HumanEval0.00
不开源
2
Qwen2.5-7B
70B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval57.90
免费商用
3
Gemma 3 - 12B (IT)
120B
SWE-bench Verified0.00
LiveCodeBench24.60
HumanEval0.00
免费商用
4
GPT-5-mini
SWE-bench Verified0.00
LiveCodeBench55.00
HumanEval0.00
不开源
5
Hunyuan-A13B-Instruct
800B
SWE-bench Verified0.00
LiveCodeBench63.90
HumanEval0.00
免费商用
6
Llama-3.2-3B
32B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval28.00
免费商用
7
Llama3.1-8B
80B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval33.50
免费商用
8
Gemma 2 - 9B
90B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval37.80
免费商用
9
Qwen2.5-3B
30B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval42.10
免费商用
10
Gemma2-27B
270B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval51.80
免费商用
11
Gemini 1.5 Pro
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval89.00
不开源
12
Qwen2.5-72B
727B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval59.10
免费商用
13
GPT-4
1750B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval67.00
不开源
14
Llama3.1-70B-Instruct
700B
SWE-bench Verified0.00
LiveCodeBench33.30
HumanEval80.50
免费商用
15
GPT-4o mini
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval87.20
不开源
16
Claude 3.5 Haiku
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval88.10
不开源
17
Qwen2.5-32B
320B
SWE-bench Verified0.00
LiveCodeBench51.20
HumanEval88.40
免费商用
18
Mistral-Small-3.1-24B-Instruct-2503
240B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval88.41
免费商用
19
Llama3.1-405B Instruct
4050B
SWE-bench Verified0.00
LiveCodeBench30.20
HumanEval89.00
免费商用