OpenAI o3
OpenAI o3 是由 OpenAI 发布的 AI 模型,发布时间为 2025-04-16,定位为 推理大模型,参数规模约为 0.0B,上下文长度为 200K,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $10 | $40 |
| 图片 | $10 | -- |
OpenAI o3 当前已收录的代表性评测结果包括 Creative Writing(2 / 22,得分 87.65)、Aider-Polyglot(3 / 26,得分 81.30)、MATH-500(5 / 43,得分 98.10)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
OpenAI o3是当前OpenAI最先进的推理大模型。作为o系列旗舰模型,该模型在复杂问题解决、跨领域分析和视觉推理任务中树立了新的性能标杆,尤其擅长需要深度逻辑推演的多步骤工作流。
基准测试o1o3(无工具)o3(全工具)
AIME 2025数学竞赛79.2%88.9%98.4%
博士级科学问题(GPQA)8.12%20.32%24.90%
视觉数学推理(MathVista)55.1%78.6%-
代码编辑任务(Aider)64.4%81.3%-
在同等延迟条件下,o3推理深度较o1提升3.2倍,复杂问题解决成功率提高42%。
该模型标志着AI系统向自主工具调度与跨模态推理的重要突破,为复杂决策场景提供新的技术基座。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
