OpenAI o3-mini 评测详情
OpenAI o3-mini 当前已收录的代表性评测结果包括 AIME2025(47 / 107,得分 86.50)、MATH-500(24 / 43,得分 95.80)、GPQA Diamond(99 / 166,得分 70.60)。
评测结果
OpenAI o3-mini
OpenAI o3-mini 当前已收录的代表性评测结果包括 AIME2025(47 / 107,得分 86.50)、MATH-500(24 / 43,得分 95.80)、GPQA Diamond(99 / 166,得分 70.60)。