大模型编程能力评测排行榜

本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。

榜首模型

-

最高得分

-

模型数量

17

数据版本

-

数据来源: 论文或GitHub评测结果

榜单历史快照月份:

排名总表

模型名称参数大小HumanEval Pass@1MBPP Pass@1发布者开源情况
暂无数据

数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。