DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
首页综合排行榜大模型编程能力评测排行榜

大模型编程能力评测排行榜

本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。

榜首模型

OpenAI o1-mini

最高得分

-

模型数量

26

数据版本

-

数据来源: 论文或GitHub评测结果

按参数规模筛选:全部3B及以下7B13B34B65B100B及以上
来源:全部国产模型
榜单历史快照月份:

排名总表

模型名称参数大小HumanEval Pass@1MBPP Pass@1发布者开源情况
OpenAIOpenAI o1-miniOpenAI—92.40—OpenAI—

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。

AnthropicClaude 3.5 SonnetAnthropic
—
92.00
—
Anthropic
—
Facebook AI研究实验室Llama3.1-405B InstructFacebook AI研究实验室4,05089.0088.60Facebook AI研究实验室—
DeepSeek-AIDeepSeek V2.5DeepSeek-AI2,36089.00—DeepSeek-AI—
亚马逊Amazon Nova Pro亚马逊—89.00—亚马逊—
xAIGrok 2xAI2,69088.40—xAI—
MistralAICodestral 25.01MistralAI—86.6080.20MistralAI—
OpenAIGPT-4OpenAI1,75085.4083.50OpenAI—
亚马逊Amazon Nova Lite亚马逊—85.40—亚马逊—
Facebook AI研究实验室Llama3-400B-Instruct-InTrainingFacebook AI研究实验室4,00084.10—Facebook AI研究实验室—
DeepSeek-AIDeepSeek-V3DeepSeek-AI6,81082.60—DeepSeek-AI—
亚马逊Amazon Nova Micro亚马逊—81.10—亚马逊—
CohereAIC4AI Command A (202503)CohereAI1,11080.00—CohereAI—
xAIGrok-1.5xAI—74.10—xAI—
DeepSeek-AIDeepSeek-V2-236B-ChatDeepSeek-AI2,36073.8061.40DeepSeek-AI—
阿里巴巴Qwen2.5-Max阿里巴巴—73.2080.60阿里巴巴—
databricksDBRX Instructdatabricks1,32070.10—databricks—
DeepSeek-AIDeepSeek-V3-BaseDeepSeek-AI6,81065.2075.40DeepSeek-AI—
xAIGrok-1xAI3,14063.20—xAI—
阿里巴巴Qwen1.5-110B阿里巴巴1,10052.4058.10阿里巴巴—
OpenAIGPT-3.5OpenAI1,75048.1052.20OpenAI—
MistralAIMixtral-8×22B-MoEMistralAI1,41045.1071.20MistralAI—
DeepSeek-AIDeepSeek-V2-236BDeepSeek-AI2,36040.9066.60DeepSeek-AI—
Google ResearchPaLM-CoderGoogle Research5,40035.9047.00Google Research—
OpenAICodexOpenAI1,75028.81—OpenAI—
Google ResearchPaLMGoogle Research5,40026.2047.00Google Research—