OpenAI o1-mini 评测详情
OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(59 / 126,得分 80.30)、MMLU(40 / 65,得分 85.20)。
评测结果
OpenAI o1-mini
评测结果
数学推理
共 4 项评测评测名称 / 模式
得分
排名/总数
OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(59 / 126,得分 80.30)、MMLU(40 / 65,得分 85.20)。