DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Benchmarks
Model Directory
Model Comparison
Resource Center
Tools
LanguageEnglish
DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

Products

  • Leaderboards
  • Model comparison
  • Datasets

Resources

  • Tutorials
  • Editorial
  • Tool directory

Company

  • About
  • Privacy policy
  • Data methodology
  • Contact

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

Privacy policyTerms of service
Page navigation
目录
Model catalogOpenAI o1-mini
OP

OpenAI o1-mini

推理大模型

OpenAI o1-mini

Release date: 2024-09-12更新于: 2025-02-15 15:29:191,065
Live demoGitHubHugging FaceCompare
Parameters
Not disclosed
Context length
128K
Chinese support
Supported
Reasoning ability

OpenAI o1-mini is an AI model published by OpenAI, released on 2024-09-12, for 推理大模型, and 128K tokens context length, under the 不开源 license.

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

OpenAI o1-mini

Model basics

Reasoning traces
Supported
Thinking modes
Thinking modes not supported
Context length
128K tokens
Max output length
No data
Model type
推理大模型
Release date
2024-09-12
Model file size
No data
MoE architecture
No
Total params / Active params
No data / N/A
Knowledge cutoff
No data
OpenAI o1-mini

Open source & experience

Code license
不开源
Weights license
不开源- 不开源
GitHub repo
GitHub link unavailable
Hugging Face
Hugging Face link unavailable
Live demo
No live demo
OpenAI o1-mini

Official resources

Paper
OpenAI o1-mini
DataLearnerAI blog
OpenAI最新的推理大模型o1与GPT-4o有什么区别?o1一定比o1 mini更强吗?一文总结OpenAI对o1模型的官方答疑
OpenAI o1-mini

API details

API speed
No data
No public API pricing yet.
OpenAI o1-mini

Benchmark Results

OpenAI o1-mini currently shows benchmark results led by HumanEval (4 / 39, score 92.40), MMLU Pro (49 / 116, score 80.30), MMLU (39 / 64, score 85.20). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.

Thinking
All modesNormalThinking

综合评估

3 evaluations
Benchmark / mode
Score
Rank/total
MMLU
Off
85.20
39 / 64
MMLU Pro
Off
80.30
49 / 116
GPQA Diamond
Off
60
128 / 166

编程与软件工程

2 evaluations
Benchmark / mode
Score
Rank/total
HumanEval
Off
92.40
4 / 39
LiveCodeBench
Off
52
77 / 109

数学推理

4 evaluations
Benchmark / mode
Score
Rank/total
MATH-500
Off
90
37 / 43
AIME 2024
Off
63.60
42 / 62
FrontierMath
Medium
1.70
43 / 54
FrontierMath
High
1.40
45 / 54
View benchmark analysisCompare with other models
OpenAI o1-mini

Publisher

OpenAI
OpenAI
View publisher details
OpenAI o1-mini

Model Overview

OpenAI于2024年9月12日推出了o1-mini模型,这是一款专为STEM领域(科学、技术、工程和数学)设计的高性价比推理模型。作为o1-preview模型的经济高效替代方案,o1-mini在多个评估基准上表现出色。

主要特点:

  • STEM推理优化: o1-mini专注于需要强大推理能力的任务,特别是在数学和编程方面。在美国数学邀请赛(AIME)和Codeforces等基准测试中,o1-mini的表现几乎与o1-preview相当。
  • 成本与速度优势: o1-mini的成本比o1-preview低约80%,为需要强大推理能力但不需要广泛世界知识的应用提供了经济实惠的解决方案。此外,o1-mini具有更高的速率限制和更低的延迟,适合实时应用。

基准测试表现:

  • 数学能力: 在AIME测试中,o1-mini取得了70.0%的得分,接近o1的74.4%,远超o1-preview的44.6%。这一成绩相当于美国前500名高中生的水平。
  • 编程能力: 在Codeforces平台上,o1-mini的Elo评分达到1650,接近o1的1673,显著高于o1-preview的1258。这意味着o1-mini位于竞争性程序员的前86%。
  • STEM推理: 在MATH-500基准测试中,o1-mini在零样本链式思维提示下达到了90.0%的准确率,展现了强大的数学问题解决能力。

技术规格:

  • 上下文窗口: o1-mini支持128,000个token的输入上下文窗口,能够在单次请求中处理大量信息。
  • 输出容量: 模型每次请求最多可生成65,500个token,确保提供详细且全面的响应。

安全性与一致性:

o1-mini采用与o1-preview相同的对齐和安全技术。内部评估显示,与GPT-4o相比,o1-mini对越狱尝试的抵抗力提高了59%,确保遵守安全指南,降低生成有害内容的风险。

局限性:

尽管o1-mini在STEM相关任务中表现出色,但其世界知识范围比o1-preview等更大的模型要窄。这意味着在需要广泛事实信息的任务中,o1-mini可能不如这些更大的模型适用。

总的来说,OpenAI的o1-mini在性能和成本之间实现了良好平衡,是专注于STEM推理任务的应用的理想选择。其优化设计确保在其专业领域内高效处理任务,同时保持输出质量。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码