OpenAI o1-mini

Name: OpenAI o1-mini
Author: OpenAI

推理大模型

OpenAI o1-mini

Release date: 2024-09-12更新于: 2025-02-15 15:29:191,065

Live demoGitHubHugging FaceCompare

Parameters

Not disclosed

Context length

128K

Chinese support

Supported

Reasoning ability

OpenAI o1-mini is an AI model published by OpenAI, released on 2024-09-12, for 推理大模型, and 128K tokens context length, under the 不开源 license.

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

OpenAI o1-mini

Model basics

Reasoning traces

Supported

Thinking modes

Thinking modes not supported

Context length

128K tokens

Max output length

No data

Model type

推理大模型

Release date

2024-09-12

Model file size

No data

MoE architecture

Total params / Active params

No data / N/A

Knowledge cutoff

No data

OpenAI o1-mini

Open source & experience

Code license

不开源

Weights license

不开源- 不开源

GitHub repo

GitHub link unavailable

Hugging Face

Hugging Face link unavailable

Live demo

No live demo

OpenAI o1-mini

Official resources

Paper

OpenAI o1-mini

DataLearnerAI blog

OpenAI o1-mini

API details

API speed

No data

No public API pricing yet.

OpenAI o1-mini

Benchmark Results

OpenAI o1-mini currently shows benchmark results led by HumanEval (4 / 39, score 92.40), MMLU Pro (49 / 116, score 80.30), MMLU (39 / 64, score 85.20). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.

综合评估

3 evaluations

Benchmark / mode

Score

Rank/total

MMLU

Off

85.20

39 / 64

MMLU Pro

Off

80.30

49 / 116

GPQA Diamond

Off

128 / 166

编程与软件工程

2 evaluations

Benchmark / mode

Score

Rank/total

HumanEval

Off

92.40

4 / 39

LiveCodeBench

Off

77 / 109

数学推理

4 evaluations

Benchmark / mode

Score

Rank/total

MATH-500

Off

37 / 43

AIME 2024

Off

63.60

42 / 62

FrontierMath

Medium

1.70

43 / 54

FrontierMath

High

1.40

45 / 54

View benchmark analysis Compare with other models

OpenAI o1-mini

Publisher

OpenAI

View publisher details

OpenAI o1-mini

Model Overview

OpenAI于2024年9月12日推出了o1-mini模型，这是一款专为STEM领域（科学、技术、工程和数学）设计的高性价比推理模型。作为o1-preview模型的经济高效替代方案，o1-mini在多个评估基准上表现出色。

主要特点：

STEM推理优化： o1-mini专注于需要强大推理能力的任务，特别是在数学和编程方面。在美国数学邀请赛（AIME）和Codeforces等基准测试中，o1-mini的表现几乎与o1-preview相当。
成本与速度优势： o1-mini的成本比o1-preview低约80%，为需要强大推理能力但不需要广泛世界知识的应用提供了经济实惠的解决方案。此外，o1-mini具有更高的速率限制和更低的延迟，适合实时应用。

基准测试表现：

数学能力：在AIME测试中，o1-mini取得了70.0%的得分，接近o1的74.4%，远超o1-preview的44.6%。这一成绩相当于美国前500名高中生的水平。
编程能力：在Codeforces平台上，o1-mini的Elo评分达到1650，接近o1的1673，显著高于o1-preview的1258。这意味着o1-mini位于竞争性程序员的前86%。
STEM推理：在MATH-500基准测试中，o1-mini在零样本链式思维提示下达到了90.0%的准确率，展现了强大的数学问题解决能力。

技术规格：

上下文窗口： o1-mini支持128,000个token的输入上下文窗口，能够在单次请求中处理大量信息。
输出容量：模型每次请求最多可生成65,500个token，确保提供详细且全面的响应。

安全性与一致性：

o1-mini采用与o1-preview相同的对齐和安全技术。内部评估显示，与GPT-4o相比，o1-mini对越狱尝试的抵抗力提高了59%，确保遵守安全指南，降低生成有害内容的风险。

局限性：

尽管o1-mini在STEM相关任务中表现出色，但其世界知识范围比o1-preview等更大的模型要窄。这意味着在需要广泛事实信息的任务中，o1-mini可能不如这些更大的模型适用。

总的来说，OpenAI的o1-mini在性能和成本之间实现了良好平衡，是专注于STEM推理任务的应用的理想选择。其优化设计确保在其专业领域内高效处理任务，同时保持输出质量。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送