SuperGLUE

Super Generalized Language Understanding Evaluation

一个包含 8 个自然语言理解任务的基准,旨在评估模型在复杂的语言理解和推理任务上的性能。

英语 难度:Advanced

主要统计信息

问题数量

8

机构

NYU & Facebook AI

类别

自然语言理解

评估指标

Varies

SuperGLUE基准测试简介

SuperGLUE 大模型得分排行榜

冠军
亚军
季军
其他排名

详细排名数据表格

模型简称 SuperGLUE得分 发布机构 发布时间 参数规模(亿)
Back to Top