GLM-4.6 评测详情
GLM-4.6 当前已收录的代表性评测结果包括 AIME2025(15 / 106,得分 98.60)、LiveCodeBench(18 / 120,得分 84.50)、MMLU Pro(43 / 126,得分 83)。
评测结果
GLM-4.6
评测结果
综合评估
共 9 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 5 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 4 项评测评测名称 / 模式
得分
排名/总数
GLM-4.6 当前已收录的代表性评测结果包括 AIME2025(15 / 106,得分 98.60)、LiveCodeBench(18 / 120,得分 84.50)、MMLU Pro(43 / 126,得分 83)。