GPT-5.6 Sol
OpenAI 于 2026 年 6 月 26 日以限定预览(limited preview)形式发布的 GPT-5.6 系列旗舰模型,面向最高难度的编程、安全研究与科学任务,新增 max 与 ultra(多子智能体)两档推理强度。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
评测结果
GPT-5.6 Sol 当前已收录的代表性评测结果包括 TerminalBench 2.1(1 / 15,得分 88.76)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
发布机构
模型解读
GPT-5.6 Sol 是 OpenAI 在 2026 年 6 月 26 日推出的 GPT-5.6 系列旗舰模型。官方在《Previewing GPT-5.6 Sol: a next-generation model》中说明:GPT-5.6 引入了新的命名体系——数字(5.6)表示模型的「代」,而 Sol、Terra、Luna 表示三个可以各自独立演进的能力档位,分别取意于太阳、地球与月亮。Sol 定位于最高档,面向最困难的任务,如复杂编程、安全研究与生物等科学领域。
本次发布为限定预览(limited preview):模型仅通过 API 与 Codex 向约 20 家合作机构开放,OpenAI 表示这是在与美国政府沟通并应其要求后采取的分阶段放量方式,计划在随后几周内逐步扩大到更广泛的 ChatGPT、Codex 与 API 用户。
推理强度与能力
GPT-5.6 Sol 在常规 low / medium / high 推理档之外,新增两档更高强度的推理:
- max:给予模型最长的思考时间,用于最复杂的单链推理问题。
- ultra:超越单一智能体的能力上限,通过调度子智能体(subagents)并行拆解、加速复杂任务。
- 输入模态:文本、图像
- 输出模态:文本
- 定位:长程编程、安全研究、生物等科学任务与 Agentic 工作流
OpenAI 同时为 Sol / Terra 引入了「激活分类器(activation classifiers)」,在输出流式返回前监控内部模式以拦截有害内容;在网络安全方面,Sol 被设计为能够识别软件漏洞、同时抵制生成完整利用链。
官方评测结果
由于本次为限定预览,OpenAI 仅公开了部分基准结果,尚未给出 SWE-bench Verified、GPQA、AIME 等标准基准的完整成绩表。已公开的代表性结果包括:
- Terminal-Bench 2.1:Sol(ultra)91.91%、Sol(max)88.76%,高于 GPT-5.5 的 83.4% 与对比基线 Claude Mythos 5 的约 88%,官方称在该终端 / 命令行 Agent 任务上达到 state of the art。
- Agent's Last Exam:Sol(code 模式)50.9%,是当时唯一越过半数线的模型。
- HealthBench:系统卡(长度调整后)Sol 在 HealthBench Professional 上 60.5、HealthBench 上 57.0。
- GeneBench v1:在优于 GPT-5.5 的同时使用了更少的 token。
- ExploitBench:与 Anthropic Mythos Preview 相当,但仅消耗约三分之一的输出 token。
在 OpenAI Preparedness 框架下,GPT-5.6 三款模型在「生物与化学」「网络安全」两个维度被评为 High,「AI 自我改进」维度为 Below High。
价格与访问
GPT-5.6 Sol 的 API 定价为每 100 万 token 输入 5 美元、输出 30 美元,与 GPT-5.5 保持一致;缓存读取保留 90% 折扣,缓存写入按未缓存输入价的 1.25 倍计费,缓存最短有效期 30 分钟。OpenAI 还计划在 7 月通过 Cerebras 硬件将 Sol 的吞吐提升至最高约 750 token/秒。
限制与注意事项
截至发布,OpenAI 尚未正式披露 GPT-5.6 的上下文窗口、最大输出长度、知识截止时间与参数规模,本条目对应字段暂留空,待官方模型卡或技术文档补充后再更新。模型当前为限定预览,普通用户与开发者暂无法直接调用。信息来源:OpenAI 官方预览博客与 GPT-5.6 Preview System Card,以及 VentureBeat、MarkTechPost、Android Authority、Axios、CNBC 等公开报道。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
