Op

OpenAI o3-mini

推理大模型

OpenAI o3-mini

发布时间: 2025-01-31

122
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
200K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

200K tokens

最长输出结果

100000 tokens

模型类型

推理大模型

发布时间

2025-01-31

模型预文件大小
暂无数据
推理模式
思考模式(Thinking Mode) 深度思考(Deeper Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 1.1 美元/ 100 万tokens 4.4 美元/ 100 万tokens

OpenAI o3-mini模型在各大评测榜单的评分

综合评估

共 3 项评测
MMLU thinking
84.90
36 / 59
GPQA Diamond thinking
70.60
67 / 133
HLE thinking
13.40
41 / 68

编程与软件工程

共 2 项评测
CodeForces thinking
2073
6 / 6
40.80
59 / 66

数学推理

共 3 项评测
MATH-500 thinking
95.80
23 / 42
AIME2025 thinking
86.50
35 / 93
AIME 2024 thinking
60
43 / 62

常识推理

共 1 项评测
Simple Bench thinking
22.80
22 / 24

发布机构

OpenAI o3-mini模型解读

OpenAI o3 mini是OpenAI发布的一个OpenAI o3模型的较小参数规模版本,速度更快。


OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1,跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。o3 mini总共分为三个版本,o3-mini low,o3-mini medium 和o3-mini high。本模型为其中最强的版本,即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时,根据测试,这个版本的模型也比之前的o1更强。


不同版本的评测结果如下:

Category01-mini03-mini (low)03-mini (medium)03-mini (high)
General85.284.985.986.9
Math90.095.897.397.9
Factuality89.955.190.892.0
Eval76.013.013.413.8



ModelReasoning LevelAverageLCB GenerationCode Completion
o3-minilow0.6180.7560.48
o3-minimedium0.7230.8460.60
o3-minihigh0.8460.8200.833
o1-minihigh0.6740.6280.72


关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat