GLM-5.2 当前已收录的代表性评测结果包括 IMO-AnswerBench(1 / 20,得分 91)、HLE(8 / 159,得分 54.70)、AIME 2026(1 / 15,得分 99.20)。