DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
← 返回总榜单

大模型编程能力评测排行榜

本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。

数据来源: 论文或GitHub评测结果

筛选条件

按参数规模筛选:全部3B及以下7B13B34B65B100B及以上
模型名称参数大小HumanEval Pass@1MBPP Pass@1发布者开源情况
Qwen2.5-Coder-32B-Instruct320.092.7090.20阿里巴巴/
Mistral Small 24B Instruct 2501240.084.80/MistralAI/
DeepSeek Coder-33B Instruct330.079.3070DeepSeek-AI/
WizardCoder-Python-34B340.073.20/WizardLM Team/
Phind-CodeLlama-34B-Python-v1340.069.50/Phind/
Phind-CodeLlama-34B-v1340.067.60/Phind/
Codestral220.061.5078.20MistralAI/
Qwen2.5-32B320.058.5084.50阿里巴巴/
CodeLLaMA-Python-34B340.053.7056.20Facebook AI研究实验室/
YAYI2-30B300.053.1045.80中科闻歌/
CodeLLaMA-34B340.048.8055Facebook AI研究实验室/
Yi-1.5-34B340.046.3065.50零一万物/
CodeLLaMA-Instruct-34B340.041.5057Facebook AI研究实验室/
Grok-0330.039.70/xAI/
Qwen1.5-32B320.037.2049.40阿里巴巴/
Aquila2-34B340.035.40/北京智源人工智能研究院/
XVERSE-MoE-A4.2B258.029.90/元象XVERSE/
LLaMA2 34B340.022.6033.80Facebook AI研究实验室/
Mistral Small 24B Base2501240.0/69.64MistralAI/

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。