OpenAI o3-mini (high) 评测详情
OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH(1 / 42,得分 97.90)、HumanEval(1 / 39,得分 97.60)、MATH-500(9 / 44,得分 97.90)。
评测结果
OpenAI o3-mini (high)
OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH(1 / 42,得分 97.90)、HumanEval(1 / 39,得分 97.60)、MATH-500(9 / 44,得分 97.90)。