GPT-4.1 nano 评测详情
GPT-4.1 nano 当前已收录的代表性评测结果包括 MMLU(49 / 64,得分 80.10)、GPQA Diamond(137 / 162,得分 50.30)、FrontierMath(46 / 54,得分 1)。
评测结果
GPT-4.1 nano
GPT-4.1 nano 当前已收录的代表性评测结果包括 MMLU(49 / 64,得分 80.10)、GPQA Diamond(137 / 162,得分 50.30)、FrontierMath(46 / 54,得分 1)。