BIG-bench

Name: BIG-bench 大模型评测基准排行榜
Creator: 数据学习 (DataLearner)
License: https://creativecommons.org/licenses/by-nc-sa/4.0/

Beyond the Imitation Game Benchmark

一个包含 200 多个不同任务的综合基准，用于评估模型的各种能力，包括推理、语言理解和知识。