DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
← 返回总榜单

大模型编程能力评测排行榜

本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。

数据来源: 论文或GitHub评测结果

筛选条件

按参数规模筛选:全部3B及以下7B13B34B65B100B及以上
模型名称参数大小HumanEval Pass@1MBPP Pass@1发布者开源情况
Qwen2.5-Omni-7B70.084.8079.20阿里巴巴/
CodeQwen1.5-7B-Chat70.083.5077.70阿里巴巴/
Llama3.1-8B-Instruct80.072.6072.80Facebook AI研究实验室/
GLM-4-9B-Chat90.071.80/智谱AI/
GLM-4-9B90.070.10/智谱AI/
DeepSeek Coder-6.7B Instruct67.066.1065.40DeepSeek-AI/
Llama3-8B80.062.20/Facebook AI研究实验室/
Llama3-8B-Instruct80.062.20/Facebook AI研究实验室/
Phi-3-small 7B70.059.1071.40Microsoft Azure/
Qwen2.5-7B70.057.9074.90阿里巴巴/
CodeGemma-7B-IT70.056.1054.20Google Research/
CodeQwen1.5-7B70.051.8072.20阿里巴巴/
Qwen2-7B70.051.2065.90阿里巴巴/
CodeGemma-7B70.044.5056.20Google Research/
Gemma 2 - 9B90.040.2052.40Google Research/
CodeLLaMA-Python-7B70.038.4047.60Facebook AI研究实验室/
PaLM2-S0.037.6050Google Research/
CodeGeeX2-6B60.035.90/智谱AI/
CodeLLaMA-Instruct-7B70.034.8044.40Facebook AI研究实验室/
WizardCoder-3B-V1.030.034.8037.40WizardLM Team/
CodeLLaMA-7B70.033.5041.40Facebook AI研究实验室/
Gemma 7B70.032.3044.40Google Research/
Mistral 7B73.030.5047.50MistralAI/
Qwen-7B70.029.9031.60阿里巴巴/
AquilaCode-7B-py70.028.80/北京智源人工智能研究院/
WizardCoder-1B-V1.010.023.8028.60WizardLM Team/
AquilaCode-7B-multi70.022/北京智源人工智能研究院/
Baichuan2-7B-Base70.018.2924.20百川智能/
LLaMA2 7B70.012.2020.80Facebook AI研究实验室/
Baichuan 7B70.09.206.60百川智能/

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。