GPT-5.6 Sol

Name: GPT-5.6 Sol
Price: 5 USD
Availability: InStock
Author: OpenAI

推理大模型编程大模型GPT-5.6

GPT-5.6 Sol

发布时间: 2026-06-2648

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

暂无数据

中文支持

支持

推理能力

OpenAI 于 2026 年 6 月 26 日以限定预览（limited preview）形式发布的 GPT-5.6 系列旗舰模型，面向最高难度的编程、安全研究与科学任务，新增 max 与 ultra（多子智能体）两档推理强度。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GPT-5.6 Sol

模型基本信息

推理过程

支持

思考模式

思考水平 · 极高 (Extra-High) (默认)常规模式思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 高 (High)思考水平 · 最高 (Max)

上下文长度

暂无数据

最大输出长度

暂无数据

模型类型

推理大模型

输入/输出模态

文本、图像 → 文本

发布时间

2026-06-26

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

GPT-5.6 Sol

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

GPT-5.6 Sol

官方介绍与博客

官方论文

Previewing GPT-5.6 Sol: a next-generation model

DataLearnerAI博客

暂无介绍博客

GPT-5.6 Sol

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$5.00/ 1M	$30.00/ 1M

缓存定价Prompt缓存

类型	有效期	写入	读取
文本	30m	$6.25/ 1M	$0.500/ 1M

GPT-5.6 Sol

评测结果

GPT-5.6 Sol 当前已收录的代表性评测结果包括 TerminalBench 2.1（1 / 15，得分 88.76）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

TerminalBench 2.1

最高

88.76

1 / 15

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

GPT-5.6 Sol

发布机构

OpenAI

查看发布机构详情

GPT-5.6 Sol

模型解读

GPT-5.6 Sol 是 OpenAI 在 2026 年 6 月 26 日推出的 GPT-5.6 系列旗舰模型。官方在《Previewing GPT-5.6 Sol: a next-generation model》中说明：GPT-5.6 引入了新的命名体系——数字（5.6）表示模型的「代」，而 Sol、Terra、Luna 表示三个可以各自独立演进的能力档位，分别取意于太阳、地球与月亮。Sol 定位于最高档，面向最困难的任务，如复杂编程、安全研究与生物等科学领域。

本次发布为限定预览（limited preview）：模型仅通过 API 与 Codex 向约 20 家合作机构开放，OpenAI 表示这是在与美国政府沟通并应其要求后采取的分阶段放量方式，计划在随后几周内逐步扩大到更广泛的 ChatGPT、Codex 与 API 用户。

推理强度与能力

GPT-5.6 Sol 在常规 low / medium / high 推理档之外，新增两档更高强度的推理：

max：给予模型最长的思考时间，用于最复杂的单链推理问题。
ultra：超越单一智能体的能力上限，通过调度子智能体（subagents）并行拆解、加速复杂任务。

输入模态：文本、图像
输出模态：文本
定位：长程编程、安全研究、生物等科学任务与 Agentic 工作流

OpenAI 同时为 Sol / Terra 引入了「激活分类器（activation classifiers）」，在输出流式返回前监控内部模式以拦截有害内容；在网络安全方面，Sol 被设计为能够识别软件漏洞、同时抵制生成完整利用链。

官方评测结果

由于本次为限定预览，OpenAI 仅公开了部分基准结果，尚未给出 SWE-bench Verified、GPQA、AIME 等标准基准的完整成绩表。已公开的代表性结果包括：

Terminal-Bench 2.1：Sol（ultra）91.91%、Sol（max）88.76%，高于 GPT-5.5 的 83.4% 与对比基线 Claude Mythos 5 的约 88%，官方称在该终端 / 命令行 Agent 任务上达到 state of the art。
Agent's Last Exam：Sol（code 模式）50.9%，是当时唯一越过半数线的模型。
HealthBench：系统卡（长度调整后）Sol 在 HealthBench Professional 上 60.5、HealthBench 上 57.0。
GeneBench v1：在优于 GPT-5.5 的同时使用了更少的 token。
ExploitBench：与 Anthropic Mythos Preview 相当，但仅消耗约三分之一的输出 token。

在 OpenAI Preparedness 框架下，GPT-5.6 三款模型在「生物与化学」「网络安全」两个维度被评为 High，「AI 自我改进」维度为 Below High。

价格与访问

GPT-5.6 Sol 的 API 定价为每 100 万 token 输入 5 美元、输出 30 美元，与 GPT-5.5 保持一致；缓存读取保留 90% 折扣，缓存写入按未缓存输入价的 1.25 倍计费，缓存最短有效期 30 分钟。OpenAI 还计划在 7 月通过 Cerebras 硬件将 Sol 的吞吐提升至最高约 750 token/秒。

限制与注意事项

截至发布，OpenAI 尚未正式披露 GPT-5.6 的上下文窗口、最大输出长度、知识截止时间与参数规模，本条目对应字段暂留空，待官方模型卡或技术文档补充后再更新。模型当前为限定预览，普通用户与开发者暂无法直接调用。信息来源：OpenAI 官方预览博客与 GPT-5.6 Preview System Card，以及 VentureBeat、MarkTechPost、Android Authority、Axios、CNBC 等公开报道。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送