BIG-bench 大模型得分排行榜
冠军
亚军
季军
其他排名
详细排名数据表格
模型简称 | BIG-bench得分 | 发布机构 | 发布时间 | 参数规模(亿) |
---|
Beyond the Imitation Game Benchmark
一个包含 200 多个不同任务的综合基准,用于评估模型的各种能力,包括推理、语言理解和知识。
200
综合评估
Varies
模型简称 | BIG-bench得分 | 发布机构 | 发布时间 | 参数规模(亿) |
---|