GPT-5.1-Codex-Max 评测详情
GPT-5.1-Codex-Max 当前已收录的代表性评测结果包括 Terminal-Bench(1 / 35,得分 58.10)、SWE-bench Verified(16 / 95,得分 76.80)。
评测结果
GPT-5.1-Codex-Max
GPT-5.1-Codex-Max 当前已收录的代表性评测结果包括 Terminal-Bench(1 / 35,得分 58.10)、SWE-bench Verified(16 / 95,得分 76.80)。