GPT-5.1

Name: GPT-5.1
Availability: InStock
Author: OpenAI

推理大模型

GPT-5.1

发布时间: 2025-11-12更新于: 2025-11-24 15:23:01921

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

400K

中文支持

支持

推理能力

GPT-5.1 是由 OpenAI 发布的 AI 模型，发布时间为 2025-11-12，定位为推理大模型，参数规模约为 0.0B，上下文长度为 400K，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GPT-5.1

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

400K tokens

最大输出长度

131072 tokens

模型类型

推理大模型

发布时间

2025-11-12

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

0.0 亿 / 不涉及

知识截止

暂无数据

GPT-5.1

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://chatgpt.com/

GPT-5.1

官方介绍与博客

官方论文

GPT-5.1: A smarter, more conversational ChatGPT

DataLearnerAI博客

OpenAI发布GPT-5.1：围绕“对话体验、一致性、任务适配性”进行的系统化优化的小幅更新！

GPT-5.1

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$1.25	$10
图片	$1.25	--

缓存计费Cache

模态	输入 Cache	输出 Cache
文本	$0.125	--
图片	$0.125	--

GPT-5.1

评测结果

GPT-5.1 当前已收录的代表性评测结果包括 MMMU（2 / 28，得分 85.40）、GPQA Diamond（23 / 169，得分 88.10）、Terminal Bench Hard（2 / 13，得分 43）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

思考模式

88.10

23 / 169

HLE

思考模式

26.50

64 / 136

查看评测深度分析与其他模型对比

GPT-5.1

发布机构

OpenAI

查看发布机构详情

GPT-5.1

模型解读

2025年11月12日，OpenAI正式发布了GPT-5.1模型，其中GPT-5.1 Thinking是推理版本的模型，在官方的介绍中，是用于替换GPT-5的，对简单问题比 GPT-5 Thinking 更快，但对难任务会刻意拉长推理时间换准确率；典型「慢工出细活」。目前，付费用户已经可以在ChatGPT网站使用，但是模型的API和更多信息并没有在当天披露。

-------------------以下为此前暴露信息----------------

在 GPT-5.1 相关泄露信息中，GPT-5.1 Reasoning 被多次提及为该家族中的推理强化版本，与基础的 GPT-5.1 和面向企业场景的 GPT-5.1 Pro 共同构成三成员模型系列。

根据 TestingCatalog 的整理以及社交媒体上对前端代码的截图，OpenAI 内部配置中出现了以 GPT-5.1 Reasoning 命名的条目，与 GPT-5.1 Pro 一同被描述为针对企业与高强度推理工作负载的变体。与此同时，GPT-5.1 Thinking 这一内部标识在 ChatGPT 的后端代码中被发现，并被多家科技媒体解读为优化多步推理与更为审慎回答过程的配置，用于处理复杂问题求解与长链条规划任务。

在开源报道中，GPT-5.1 Reasoning 通常被视为承接 GPT-5 Pro 系列“扩展推理能力”定位的后续版本：通过更长的思考过程、更高的计算预算以及更精细的推理策略来提升在复杂推理任务、研究级问题以及多步骤工具调用场景中的稳定性。然而，目前尚无公开的系统卡或技术报告详细说明该版本的参数规模、上下文窗口、思考预算配置或在标准基准（如 MMLU、GPQA 等）上的具体得分。

因此，从公开可验证的信息出发，可以将 GPT-5.1 Reasoning 谨慎地归类为 GPT-5.1 家族中面向深度推理与多步骤问题求解的强化版本，其核心特点在于对推理路径与答案可靠性的优化，而非仅仅提升生成速度或通用对话体验。关于其具体硬件需求、性能边界以及与基础版 GPT-5.1 的量化差异，目前仍缺乏来自 OpenAI 官方的详细数据说明。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

模态

输入

输出

文本

$1.25

$10

图片

$1.25

模态

输入 Cache

输出 Cache

文本

$0.125

图片

$0.125