GLM-4-9B-Chat 评测详情

GLM-4-9B-Chat 当前已收录的代表性评测结果包括 GPQA（7 / 15，得分 58.50）、AIME 2024（34 / 62，得分 76.40）、MMLU Pro（90 / 132，得分 72.40）。

评测结果

GLM-4-9B-Chat

评测结果

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

72.40

90 / 132

58.50

7 / 15

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

76.40

34 / 62

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总数

51.80

90 / 123

与其他模型对比