DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
← 返回总榜单

大模型编程能力评测排行榜

本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。

数据来源: 论文或GitHub评测结果

筛选条件

按参数规模筛选:全部3B及以下7B13B34B65B100B及以上
模型名称参数大小HumanEval Pass@1MBPP Pass@1发布者开源情况
OpenAI o1-mini/92.40/OpenAI/
Claude 3.5 Sonnet/92/Anthropic/
Llama3.1-405B Instruct4050.08988.60Facebook AI研究实验室/
DeepSeek V2.52360.089/DeepSeek-AI/
Amazon Nova Pro/89/亚马逊/
Grok 22690.088.40/xAI/
Codestral 25.01/86.6080.20MistralAI/
GPT-41750.085.4083.50OpenAI/
Amazon Nova Lite/85.40/亚马逊/
Llama3-400B-Instruct-InTraining4000.084.10/Facebook AI研究实验室/
DeepSeek-V36810.082.60/DeepSeek-AI/
Amazon Nova Micro/81.10/亚马逊/
C4AI Command A (202503)1110.080/CohereAI/
Grok-1.5/74.10/xAI/
DeepSeek-V2-236B-Chat2360.073.8061.40DeepSeek-AI/
Qwen2.5-Max/73.2080.60阿里巴巴/
DBRX Instruct1320.070.10/databricks/
DeepSeek-V3-Base6810.065.2075.40DeepSeek-AI/
Grok-13140.063.20/xAI/
Qwen1.5-110B1100.052.4058.10阿里巴巴/
GPT-3.51750.048.1052.20OpenAI/
Mixtral-8×22B-MoE1410.045.1071.20MistralAI/
DeepSeek-V2-236B2360.040.9066.60DeepSeek-AI/
PaLM-Coder5400.035.9047Google Research/
Codex1750.028.81/OpenAI/
PaLM5400.026.2047Google Research/

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。