OpenAI o3-mini

Name: OpenAI o3-mini
Price: 1.1 USD
Availability: InStock
Author: OpenAI

推理大模型o Minio3

OpenAI o3-mini

发布时间: 2025-01-31更新于: 2025-08-04 10:44:52505

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

200K

中文支持

支持

推理能力

OpenAI o3-mini 是由 OpenAI 发布的 AI 模型，发布时间为 2025-01-31，定位为推理大模型，上下文长度为 200K，采用不开源许可，在 CodeForces 上取得 2073.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

OpenAI o3-mini

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

200K tokens

最大输出长度

100K tokens

模型类型

推理大模型

输入/输出模态

文本 → 文本

发布时间

2025-01-31

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

OpenAI o3-mini

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://chat.openai.com/

OpenAI o3-mini

官方介绍与博客

官方论文

OpenAI o3-mini

DataLearnerAI博客

暂无介绍博客

OpenAI o3-mini

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$1.10/ 1M	$4.40/ 1M

OpenAI o3-mini

评测结果

OpenAI o3-mini 当前已收录的代表性评测结果包括 Aider-Polyglot（21 / 59，得分 60.40）、AIME2025（47 / 106，得分 86.50）、FrontierMath - Tier 4（40 / 80，得分 4.20）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

MMLU

84.90

41 / 65

GPQA Diamond

70.60

113 / 180

HLE

13.40

131 / 164

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

CodeForces

2073

13 / 16

SWE-bench Verified

40.80

99 / 109

数学推理

共 4 项评测

评测名称 / 模式

得分

排名/总数

MATH-500

95.80

24 / 44

AIME2025

86.50

47 / 106

AIME 2024

42 / 62

FrontierMath - Tier 4

高

4.20

40 / 80

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

高

22.80

55 / 63

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

Aider-Polyglot

中

53.80

29 / 59

Aider-Polyglot

高

60.40

21 / 59

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

OpenAI o3-mini

发布机构

OpenAI

查看发布机构详情

OpenAI o3-mini

模型解读

OpenAI o3 mini是OpenAI发布的一个OpenAI o3模型的较小参数规模版本，速度更快。

OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1，跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。o3 mini总共分为三个版本，o3-mini low，o3-mini medium 和o3-mini high。本模型为其中最强的版本，即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时，根据测试，这个版本的模型也比之前的o1更强。

不同版本的评测结果如下：

Category	01-mini	03-mini (low)	03-mini (medium)	03-mini (high)
General	85.2	84.9	85.9	86.9
Math	90.0	95.8	97.3	97.9
Factuality	89.9	55.1	90.8	92.0
Eval	76.0	13.0	13.4	13.8

Model	Reasoning Level	Average	LCB Generation	Code Completion
o3-mini	low	0.618	0.756	0.48
o3-mini	medium	0.723	0.846	0.60
o3-mini	high	0.846	0.820	0.833
o1-mini	high	0.674	0.628	0.72

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送