加载中...
加载中...
Follow DataLearner WeChat for the latest AI updates

OpenAI 在 2025 年 11 月推出了 GPT-5.1。相比此前的 GPT-5,这次更新并不是围绕“再拉高能力上限”来讲故事,而是更集中在几个具体问题上:推理节奏、交互一致性、风格控制,以及在公开评测中的表现。

从目前公开信息和社区讨论来看,我更愿意把 GPT-5.1 理解成:
把 GPT-5 调到一个更适合长期真实使用的状态,而不是开辟一条全新的技术路线。
[toc]
根据 OpenAI 的官方介绍,GPT-5.1 被明确拆成两个主力模式:Instant 和 Thinking。
这两个模式不是“大小不同”的两个模型,而是推理策略与适用场景的区分。
适用的典型任务包括:解释、总结、写草稿、轻量规划、日常沟通等。
适用的典型任务包括:数学推导、多约束问题、代码逻辑分析、跨多轮的长链条问题解决等。
从这两个路径的设计可以看出,GPT-5.1 试图解决 GPT-5 时代一个比较典型的问题:
简单任务容易被过度推理,复杂任务则不够深入。
现在,“任务有多难”和“模型愿意想多久”之间,开始出现显式的设计关联。
GPT-5 刚发布时,外界对它的能力评价整体不低,但对“使用体验”的意见不少,尤其集中在:
如果只看 GPT-5.1 的更新方向,很容易发现它是对着这些问题去做调整的:
对话体验 官方反复使用 “more conversational” 这类描述,说明对话时的自然度与连续性是这次优化的重点之一。
自适应推理 Instant 和 Thinking 两个模式都以不同形式引入“按需思考”的策略,从而减少完全依赖提示工程来强行拉长推理链的情况。
风格与人格配置 GPT-5.1 支持多种预设对话风格,例如 Professional、Friendly、Candid、Nerdy 等,可以在前端直接选择。
这些变化背后,其实指向同一目标:
让模型在真实场景中表现得更稳定、更可预期,而不是每一轮都像在抽不同版本的“人格”。
如果只看官方资料,会觉得 GPT-5.1 的定位还是比较“泛用”的。但在社区主导的评测里,它在某些纵向能力上的表现已经被拉了出来,其中比较具代表性的一条,就是创意写作。
目前有几个关键信息可以放在一起看:
综合这些公开信号,一个相对稳妥的表述是:
在 EQ-Bench 的 Creative Writing v3 榜单上,polaris-alpha 目前位居第一,而社区主流观点认为它对应的是 GPT-5.1 系列模型。
这至少说明,在创意写作这一纵向能力上,GPT-5.1 系列在社区基准中有一个清晰的“锚点”: 不是泛泛而谈“写作不错”,而是在一个公开排行榜上处于头部位置。
从技术视角来看,我觉得 GPT-5.1 最大的变化,不是参数规模,而是:
把“推理要花多久时间”这件事纳入了模型内部的正式设计。
在之前的模型中:
而在 GPT-5.1 中:
这和近两年反复出现的几个概念是对应的: test-time compute、thinking tokens、多阶段推理等——它们共同指向一个方向:
模型不再只是“给定算力、尽量用满”,而是“在算力预算内,为每个任务分配合适的思考资源”。
从工程实践的角度,这会直接影响准确率 / 成本 / 时延三者的组合方式。官方也给出了一个GPT-5.1和此前模型的对比图:

这个对比图最重要的信息就是说明在不需要复杂推理的场景,GPT-5.1可以使用更少的tokens给出答案。而面对更加复杂的问题的时候,它可以花费更多时间找到解决方案。这也是本次升级最大的特点。除此之外,官方没有给出任何评测对比。
另一个明显的变化,是 GPT-5.1 中对对话风格的产品化支持。
公开信息显示,GPT-5.1 支持多种预设风格,比如 Default、Professional、Friendly、Candid、Efficient、Nerdy、Cynical 等,用户可以在前端选择。
这件事的意义不只是在“好玩”,而是直接关系到产品长期运营:
对任何需要在统一平台上提供不同角色体验的产品来说,这都是一个很实用的设计点。
这里我只谈“评估维度”,而不是“已经做过哪些实验”。
如果在一个系统里考虑引入 GPT-5.1,我会重点关注以下几个方向:
这些因素,都更偏向“可长期运行的产品”,而不是单次调用体验。
基于目前公开资料、社区评测以及 Creative Writing v3 榜单的间接信号,我的个人结论大致是:
如果把 GPT-4 时代的关键词看作是“把能力推到一个新高度”, 那 GPT-5.1 的关键词,更接近于:
在达到这个高度之后,模型能不能在真实世界里长期站得住。
截止目前,官方还没有公开GPT-5.1的API接口和模型信息,大家可以关注DataLearnerAI的模型信息卡和其它信息:
https://www.datalearner.com/ai-models/pretrained-models/gpt-5-1 https://www.datalearner.com/ai-models/pretrained-models/gpt-5-1-reasoning
此外,很快OpenAI也会推出GPT-5.1 Pro和GPT-5.1-Codex版本。