GP

GPT-5.6 Sol

推理大模型编程大模型GPT-5.6

GPT-5.6 Sol

发布时间: 2026-06-2648
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
暂无数据
中文支持
支持
推理能力

OpenAI 于 2026 年 6 月 26 日以限定预览(limited preview)形式发布的 GPT-5.6 系列旗舰模型,面向最高难度的编程、安全研究与科学任务,新增 max 与 ultra(多子智能体)两档推理强度。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-5.6 Sol

模型基本信息

推理过程
支持
思考模式
思考水平 · 极高 (Extra-High) (默认)常规模式思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 高 (High)思考水平 · 最高 (Max)
上下文长度
暂无数据
最大输出长度
暂无数据
模型类型
推理大模型
输入/输出模态
文本、图像 → 文本
发布时间
2026-06-26
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
GPT-5.6 Sol

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
GPT-5.6 Sol

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
GPT-5.6 Sol

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准模式
类型适用条件输入输出
文本-$5.00/ 1M$30.00/ 1M
缓存定价Prompt缓存
类型有效期写入读取
文本30m$6.25/ 1M$0.500/ 1M
GPT-5.6 Sol

评测结果

GPT-5.6 Sol 当前已收录的代表性评测结果包括 TerminalBench 2.1(1 / 15,得分 88.76)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
88.76
1 / 15

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

GPT-5.6 Sol

发布机构

GPT-5.6 Sol

模型解读

GPT-5.6 Sol 是 OpenAI 在 2026 年 6 月 26 日推出的 GPT-5.6 系列旗舰模型。官方在《Previewing GPT-5.6 Sol: a next-generation model》中说明:GPT-5.6 引入了新的命名体系——数字(5.6)表示模型的「代」,而 Sol、Terra、Luna 表示三个可以各自独立演进的能力档位,分别取意于太阳、地球与月亮。Sol 定位于最高档,面向最困难的任务,如复杂编程、安全研究与生物等科学领域。

本次发布为限定预览(limited preview):模型仅通过 API 与 Codex 向约 20 家合作机构开放,OpenAI 表示这是在与美国政府沟通并应其要求后采取的分阶段放量方式,计划在随后几周内逐步扩大到更广泛的 ChatGPT、Codex 与 API 用户。


推理强度与能力

GPT-5.6 Sol 在常规 low / medium / high 推理档之外,新增两档更高强度的推理:

  • max:给予模型最长的思考时间,用于最复杂的单链推理问题。
  • ultra:超越单一智能体的能力上限,通过调度子智能体(subagents)并行拆解、加速复杂任务。
  • 输入模态:文本、图像
  • 输出模态:文本
  • 定位:长程编程、安全研究、生物等科学任务与 Agentic 工作流

OpenAI 同时为 Sol / Terra 引入了「激活分类器(activation classifiers)」,在输出流式返回前监控内部模式以拦截有害内容;在网络安全方面,Sol 被设计为能够识别软件漏洞、同时抵制生成完整利用链。


官方评测结果

由于本次为限定预览,OpenAI 仅公开了部分基准结果,尚未给出 SWE-bench Verified、GPQA、AIME 等标准基准的完整成绩表。已公开的代表性结果包括:

  • Terminal-Bench 2.1:Sol(ultra)91.91%、Sol(max)88.76%,高于 GPT-5.5 的 83.4% 与对比基线 Claude Mythos 5 的约 88%,官方称在该终端 / 命令行 Agent 任务上达到 state of the art。
  • Agent's Last Exam:Sol(code 模式)50.9%,是当时唯一越过半数线的模型。
  • HealthBench:系统卡(长度调整后)Sol 在 HealthBench Professional 上 60.5、HealthBench 上 57.0。
  • GeneBench v1:在优于 GPT-5.5 的同时使用了更少的 token。
  • ExploitBench:与 Anthropic Mythos Preview 相当,但仅消耗约三分之一的输出 token。

在 OpenAI Preparedness 框架下,GPT-5.6 三款模型在「生物与化学」「网络安全」两个维度被评为 High,「AI 自我改进」维度为 Below High。


价格与访问

GPT-5.6 Sol 的 API 定价为每 100 万 token 输入 5 美元、输出 30 美元,与 GPT-5.5 保持一致;缓存读取保留 90% 折扣,缓存写入按未缓存输入价的 1.25 倍计费,缓存最短有效期 30 分钟。OpenAI 还计划在 7 月通过 Cerebras 硬件将 Sol 的吞吐提升至最高约 750 token/秒。


限制与注意事项

截至发布,OpenAI 尚未正式披露 GPT-5.6 的上下文窗口、最大输出长度、知识截止时间与参数规模,本条目对应字段暂留空,待官方模型卡或技术文档补充后再更新。模型当前为限定预览,普通用户与开发者暂无法直接调用。信息来源:OpenAI 官方预览博客与 GPT-5.6 Preview System Card,以及 VentureBeat、MarkTechPost、Android Authority、Axios、CNBC 等公开报道。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码