GPT-4.1 mini 评测详情
GPT-4.1 mini 当前已收录的代表性评测结果包括 MMLU(21 / 64,得分 87.50)、IC SWE-Lancer(Diamond)(4 / 8,得分 33)、FrontierMath(33 / 54,得分 4.50)。
评测结果
GPT-4.1 mini
GPT-4.1 mini 当前已收录的代表性评测结果包括 MMLU(21 / 64,得分 87.50)、IC SWE-Lancer(Diamond)(4 / 8,得分 33)、FrontierMath(33 / 54,得分 4.50)。