DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表OpenAI o3-mini (high)
OP

OpenAI o3-mini (high)

OpenAI o3-mini (high)

发布时间: 2025-01-31更新于: 2025-02-09 11:49:40926
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128k
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

OpenAI o3-mini (high)

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128k tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2025-01-31
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
OpenAI o3-mini (high)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
OpenAI o3-mini (high)

官方介绍与博客

官方论文
OpenAI o3-mini
DataLearnerAI博客
暂无介绍博客
OpenAI o3-mini (high)

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
OpenAI o3-mini (high)

评测结果

OpenAI o3-mini (high) 当前已收录的代表性评测结果包括 MATH(1 / 41,得分 97.90)、HumanEval(1 / 37,得分 97.60)、MATH-500(9 / 43,得分 97.90)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
MMLU
关闭
86.90
25 / 62
GPQA Diamond
关闭
79.70
62 / 160
ARC-AGI
关闭
34.50
36 / 49

编程与软件工程

共 3 项评测
评测名称 / 模式
得分
排名/总数
HumanEval
关闭
97.60
1 / 37
LiveCodeBench
关闭
69.50
42 / 106
SWE-bench Verified
关闭
49.30
75 / 90

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
MATH
关闭
97.90
1 / 41
MATH-500
关闭
97.90
9 / 43
AIME 2024
关闭
87
18 / 62

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
关闭
13.80
35 / 45
查看评测深度分析与其他模型对比
OpenAI o3-mini (high)

发布机构

OpenAI
OpenAI
查看发布机构详情
OpenAI o3-mini (high)

模型解读

OpenAI o3 mini是OpenAI发布的第二代推理大模型中最小规模的版本。第一代推理大模型是o1,跳过了o2版本号的原因可能是o2与英国电信运营商的品牌冲突。


o3 mini总共分为三个版本,o3-mini low,o3-mini medium 和o3-mini high。本模型为其中最强的版本,即o3-mini high。ChatGPT中免费用户使用的是o3-mini meidum版本。Plus用户可以选择这个版本。同时,根据测试,这个版本的模型也比之前的o1更强。


不同版本的评测结果如下:

Category01-mini03-mini (low)03-mini (medium)03-mini (high)
General85.284.985.986.9
Math90.095.897.397.9
Factuality89.955.190.892.0
Eval76.013.013.413.8



ModelReasoning LevelAverageLCB GenerationCode Completion
o3-minilow0.6180.7560.48
o3-minimedium0.7230.8460.60
o3-minihigh0.8460.8200.833
o1-minihigh0.6740.6280.72


DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码