GLM-4-9B-Chat 评测详情
GLM-4-9B-Chat 当前已收录的代表性评测结果包括 GPQA(6 / 14,得分 58.50)、AIME 2024(34 / 62,得分 76.40)、MMLU Pro(79 / 118,得分 72.40)。
评测结果
GLM-4-9B-Chat
GLM-4-9B-Chat 当前已收录的代表性评测结果包括 GPQA(6 / 14,得分 58.50)、AIME 2024(34 / 62,得分 76.40)、MMLU Pro(79 / 118,得分 72.40)。