Gemini 2.5 Deep Think 评测详情
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(3 / 109,得分 87.60)、AIME2025(11 / 107,得分 99.20)、FrontierMath(6 / 54,得分 29)。
评测结果
Gemini 2.5 Deep Think
Gemini 2.5 Deep Think 当前已收录的代表性评测结果包括 LiveCodeBench(3 / 109,得分 87.60)、AIME2025(11 / 107,得分 99.20)、FrontierMath(6 / 54,得分 29)。