OP

OpenAI o3-mini (high)

OpenAI o3-mini (high)

发布时间: 2025-01-31更新于: 2025-02-09 11:49:40926

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

128k

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

OpenAI o3-mini (high)

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128k tokens

最大输出长度

暂无数据

模型类型

推理大模型

发布时间

2025-01-31

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

OpenAI o3-mini (high)

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

OpenAI o3-mini (high)

官方介绍与博客

官方论文

DataLearnerAI博客

暂无介绍博客

OpenAI o3-mini (high)

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

OpenAI o3-mini (high)

评测结果

OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH（1 / 41，得分 97.90）、HumanEval（1 / 37，得分 97.60）、MATH-500（9 / 43，得分 97.90）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

关闭

86.90

25 / 62

关闭

79.70

62 / 160

关闭

34.50

36 / 49

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总数

关闭

97.60

1 / 37

关闭

69.50

42 / 106

SWE-bench Verified

关闭

49.30

75 / 90

数学推理

共 3 项评测

评测名称 / 模式

得分

排名/总数

关闭

97.90

1 / 41

关闭

97.90

9 / 43

关闭

87

18 / 62

常识问答

共 1 项评测

评测名称 / 模式

得分

排名/总数

关闭

13.80

35 / 45

查看评测深度分析与其他模型对比

OpenAI o3-mini (high)

发布机构

OpenAI

查看发布机构详情

OpenAI o3-mini (high)

模型解读

OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1，跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。

o3 mini总共分为三个版本，o3-mini low，o3-mini medium 和o3-mini high。本模型为其中最强的版本，即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时，根据测试，这个版本的模型也比之前的o1更强。

不同版本的评测结果如下：

Category	01-mini	03-mini (low)	03-mini (medium)	03-mini (high)
General	85.2	84.9	85.9	86.9
Math	90.0	95.8	97.3	97.9
Factuality	89.9	55.1	90.8	92.0
Eval	76.0	13.0	13.4	13.8

Model	Reasoning Level	Average	LCB Generation	Code Completion
o3-mini	low	0.618	0.756	0.48
o3-mini	medium	0.723	0.846	0.60
o3-mini	high	0.846	0.820	0.833
o1-mini	high	0.674	0.628	0.72

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码