OpenAI o3-mini (high) 评测详情
OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH(1 / 42,得分 97.90)、HumanEval(1 / 39,得分 97.60)、MATH-500(9 / 44,得分 97.90)。
评测结果
OpenAI o3-mini (high)
评测结果
编程与软件工程
共 3 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 5 项评测评测名称 / 模式
得分
排名/总数
OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH(1 / 42,得分 97.90)、HumanEval(1 / 39,得分 97.60)、MATH-500(9 / 44,得分 97.90)。