DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表OpenAI o1-mini
OP

OpenAI o1-mini

推理大模型

OpenAI o1-mini

发布时间: 2024-09-12更新于: 2025-02-15 15:29:191,065
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128K
中文支持
支持
推理能力

OpenAI o1-mini 是由 OpenAI 发布的 AI 模型,发布时间为 2024-09-12,定位为 推理大模型,上下文长度为 128K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

OpenAI o1-mini

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2024-09-12
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
OpenAI o1-mini

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
OpenAI o1-mini

官方介绍与博客

官方论文
OpenAI o1-mini
DataLearnerAI博客
OpenAI最新的推理大模型o1与GPT-4o有什么区别?o1一定比o1 mini更强吗?一文总结OpenAI对o1模型的官方答疑
OpenAI o1-mini

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
OpenAI o1-mini

评测结果

OpenAI o1-mini 当前已收录的代表性评测结果包括 HumanEval(4 / 39,得分 92.40)、MMLU Pro(49 / 116,得分 80.30)、MMLU(39 / 64,得分 85.20)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考
思考模式细分 (2)
全部默认 (中)高

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
FrontierMath
中
1.70
43 / 54
FrontierMath
高
1.40
45 / 54
查看评测深度分析与其他模型对比
OpenAI o1-mini

发布机构

OpenAI
OpenAI
查看发布机构详情
OpenAI o1-mini

模型解读

OpenAI于2024年9月12日推出了o1-mini模型,这是一款专为STEM领域(科学、技术、工程和数学)设计的高性价比推理模型。作为o1-preview模型的经济高效替代方案,o1-mini在多个评估基准上表现出色。

主要特点:

  • STEM推理优化: o1-mini专注于需要强大推理能力的任务,特别是在数学和编程方面。在美国数学邀请赛(AIME)和Codeforces等基准测试中,o1-mini的表现几乎与o1-preview相当。
  • 成本与速度优势: o1-mini的成本比o1-preview低约80%,为需要强大推理能力但不需要广泛世界知识的应用提供了经济实惠的解决方案。此外,o1-mini具有更高的速率限制和更低的延迟,适合实时应用。

基准测试表现:

  • 数学能力: 在AIME测试中,o1-mini取得了70.0%的得分,接近o1的74.4%,远超o1-preview的44.6%。这一成绩相当于美国前500名高中生的水平。
  • 编程能力: 在Codeforces平台上,o1-mini的Elo评分达到1650,接近o1的1673,显著高于o1-preview的1258。这意味着o1-mini位于竞争性程序员的前86%。
  • STEM推理: 在MATH-500基准测试中,o1-mini在零样本链式思维提示下达到了90.0%的准确率,展现了强大的数学问题解决能力。

技术规格:

  • 上下文窗口: o1-mini支持128,000个token的输入上下文窗口,能够在单次请求中处理大量信息。
  • 输出容量: 模型每次请求最多可生成65,500个token,确保提供详细且全面的响应。

安全性与一致性:

o1-mini采用与o1-preview相同的对齐和安全技术。内部评估显示,与GPT-4o相比,o1-mini对越狱尝试的抵抗力提高了59%,确保遵守安全指南,降低生成有害内容的风险。

局限性:

尽管o1-mini在STEM相关任务中表现出色,但其世界知识范围比o1-preview等更大的模型要窄。这意味着在需要广泛事实信息的任务中,o1-mini可能不如这些更大的模型适用。

总的来说,OpenAI的o1-mini在性能和成本之间实现了良好平衡,是专注于STEM推理任务的应用的理想选择。其优化设计确保在其专业领域内高效处理任务,同时保持输出质量。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码