DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
返回总榜单

大模型代码编程能力评测排行榜

本页面提供大模型代码编程能力评测排行榜,涵盖 SWE-Bench、LiveCodeBench、HumanEval 等数据集,对 GPT、Claude、Qwen、DeepSeek 等模型进行对比。

数据更新于: 2025/10/12 20:54:51

评测切换

在这里切换评测,图表和表格会同步更新

SWE-bench VerifiedLiveCodeBenchHumanEval

还有更多评测基准

进入评测基准列表,按类别/语言快速筛选

更多评测

筛选

已筛选
全部3B及以下7B13B34B65B100B及以上
全部推理大模型基座大模型指令优化/聊天优化大模型编程大模型

大模型性能评测结果

数据来源:DataLearnerAI
排名模型SWE-bench VerifiedLiveCodeBenchHumanEval参数(亿)开源情况
1Qwen3-Coder-Next70.600.000.0080B免费商用
2Llama3.1-8B-Instruct0.000.0066.5080B免费商用
3
Qwen2.5-7B
0.00
0.00
57.90
70B
免费商用
4Gemma 2 - 9B0.000.0037.8090B免费商用
5Llama3.1-8B0.000.0033.5080B免费商用
6Mistral-7B-Instruct-v0.30.000.0029.3070B免费商用
7Pangu Embedded0.0067.100.0070B免费商用
8Qwen3-8B0.0061.800.0080B免费商用
9Hunyuan-7B0.0057.000.0070B免费商用
10Qwen3-4B-Thinking-25070.0055.200.0040B免费商用
11GLM-4-9B-Chat0.0051.800.0090B免费商用
12Qwen3-4B-25070.0035.100.0040B免费商用
1
Qwen3-Coder-Next
80B
SWE-bench Verified70.60
LiveCodeBench0.00
HumanEval0.00
免费商用
2
Llama3.1-8B-Instruct
80B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval66.50
免费商用
3
Qwen2.5-7B
70B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval57.90
免费商用
4
Gemma 2 - 9B
90B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval37.80
免费商用
5
Llama3.1-8B
80B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval33.50
免费商用
6
Mistral-7B-Instruct-v0.3
70B
SWE-bench Verified0.00
LiveCodeBench0.00
HumanEval29.30
免费商用
7
Pangu Embedded
70B
SWE-bench Verified0.00
LiveCodeBench67.10
HumanEval0.00
免费商用
8
Qwen3-8B
80B
SWE-bench Verified0.00
LiveCodeBench61.80
HumanEval0.00
免费商用
9
Hunyuan-7B
70B
SWE-bench Verified0.00
LiveCodeBench57.00
HumanEval0.00
免费商用
10
Qwen3-4B-Thinking-2507
40B
SWE-bench Verified0.00
LiveCodeBench55.20
HumanEval0.00
免费商用
11
GLM-4-9B-Chat
90B
SWE-bench Verified0.00
LiveCodeBench51.80
HumanEval0.00
免费商用
12
Qwen3-4B-2507
40B
SWE-bench Verified0.00
LiveCodeBench35.10
HumanEval0.00
免费商用