Gemini 2.5 Deep Think 评测详情
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(9 / 120,得分 87.60)、AIME2025(11 / 106,得分 99.20)、FrontierMath(12 / 60,得分 29)。
评测结果
Gemini 2.5 Deep Think
评测结果
数学推理
共 4 项评测评测名称 / 模式
得分
排名/总数
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(9 / 120,得分 87.60)、AIME2025(11 / 106,得分 99.20)、FrontierMath(12 / 60,得分 29)。