本页面提供当前主流大模型在代码能力上的评测结果,包括HumanEval和MBPP等基准数据集。
榜首模型
-
最高得分
模型数量
17
数据版本
数据来源: 论文或GitHub评测结果
数据仅供参考,以官方来源为准。模型名称旁的链接可跳转到 DataLearner 模型详情页。