GPT-5.5 Pro

Name: GPT-5.5 Pro
Price: 30 USD
Availability: InStock
Author: OpenAI

推理大模型

GPT-5.5 Pro

发布时间: 2026-04-23更新于: 2026-04-28 10:54:58.708254

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

1000K

中文支持

支持

推理能力

GPT-5.5 Pro 是由 OpenAI 发布的 AI 模型，发布时间为 2026-04-23，定位为推理大模型，参数规模约为 0.0B，上下文长度为 1000K，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GPT-5.5 Pro

模型基本信息

推理过程

支持

思考模式

思考水平 · 高 (High) (默认)思考水平 · 中 (Medium)思考水平 · 极高 (Extra-High)

上下文长度

1000K tokens

最大输出长度

131072 tokens

模型类型

推理大模型

发布时间

2026-04-23

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

GPT-5.5 Pro

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://chatgpt.com/

GPT-5.5 Pro

官方介绍与博客

官方论文

Introducing GPT‑5.5

DataLearnerAI博客

OpenAI 发布 GPT-5.5：代号

GPT-5.5 Pro

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$30.00/ 1M	$180.00/ 1M

GPT-5.5 Pro

评测结果

GPT-5.5 Pro 当前已收录的代表性评测结果包括 FrontierMath - Tier 4（1 / 80，得分 39.60）、ARC-AGI（1 / 65，得分 96.50）、FrontierMath（1 / 60，得分 52.40）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

极高工具联网

90.10

1 / 43

查看评测深度分析与其他模型对比

GPT-5.5 Pro

发布机构

OpenAI

查看发布机构详情

GPT-5.5 Pro

模型解读

2026年4月23日，OpenAI 正式推出了 GPT-5.5 系列模型，其中包括标准版 GPT-5.5 以及性能更强的高阶版本 GPT-5.5 Pro。标准版已展现出全面领先的基础智能，而本文的主角——GPT-5.5 Pro——则被设计为一个真正面向复杂工作场景的智能体模型。它不再满足于被动应答，而是能够自主规划任务、调用工具、校验执行结果，并在模糊与歧义中持续做出正确判断。该模型目前仅向 Pro、Business 和 Enterprise 订阅用户开放。

不止更聪明，还更省资源

GPT-5.5 Pro 最直观的进化体现在效率上。通过和英伟达硬件协同设计，它在保持与上代相近单 Token 延迟的前提下，将生成速度提升了超过 20%。更关键的是，在完成同一项 Codex 编码任务时，整个 GPT-5.5 系列消耗的 Token 数量大幅减少，这意味着 GPT-5.5 Pro 能真正做到花更少的计算资源办更难的事。

基准测试中的绝对领先

GPT-5.5 Pro 在广泛的智力评测中确立了优势，尤其在需要深度推理和长时间规划的项目上，拉开了与标准版 GPT-5.5 的差距。

评测基准核心考察能力GPT-5.5 得分GPT-5.5 Pro 得分

BrowseComp浏览与复杂信息理解84.4%90.1%

FrontierMath Tier 4高难度数学推理35.4%39.6%

GDPval跨44种知识职业的知识工作84.9%82.3%

SWE-Bench Pro真实 GitHub 问题解决58.6%-

Terminal-Bench 2.0复杂命令行任务82.7%-

在 BrowseComp 和 FrontierMath 这类对推理连贯性要求极高的测试中，GPT-5.5 Pro 取得了对标准版的显著领先，在知识工作评测 GDPval 上也保持着一流水准。

专业深水区的表现

GPT-5.5 Pro 能够深入专业研究腹地。在评测生物信息学能力的 BixBench 上，它拿到了 80.5% 的分数，为所有已知公开成绩中的最高水平。数学方面，一个内部版本的模型成功证明了一项关于 Ramsey 数的长期猜想，并用证明助手 Lean 完成了形式化验证。网络安全领域，GPT-5.5 Pro 在 CyberGym 基准中得到 81.8% 的分数，远超过 Claude 4.7 的 73.1%。

开发者的新大脑

GPT-5.5 Pro 的编码能力获得了早期体验者一边倒的认可。它能整体把握大型代码库的结构，主动预判潜在的架构隐患，甚至独立给出足以媲美资深工程师的系统重构方案。有多位测试者形容，一旦用惯了这种深度协作，失去访问权限会产生强烈的缺失感。一些开发工具平台的负责人也公开表示，该模型在长达数小时的复杂任务中展现出的韧性令人印象深刻。

定价与访问方式

GPT-5.5 Pro 的 API 价格为每百万输入 Token 30 美元，每百万输出 Token 180 美元，接近标准版 GPT-5.5 输出价格的 6 倍。模型随 ChatGPT 和 Codex 向 Pro、Business、Enterprise 用户分批推送，支持高达 100 万 Token 的超长上下文窗口，足以一次性消化数千页技术文档。

面向风险重新设计的安全体系

OpenAI 按照其 Preparedness Framework 对 GPT-5.5 系列进行了严格评估，并将该模型在生物、化学及网络安全方向的潜在能力评定为 High 等级。相应地，GPT-5.5 Pro 部署了被内部称为迄今最强的一整套安全防护机制，尤其加强了对高风险网络操作请求的审查与遏制。

竞争格局与争议

第三方机构 Artificial Analysis 的综合智能指数榜单上，GPT-5.5 系列直接占据前两位，GPT-5.5 Pro 力压 Anthropic 的 Claude Opus 4.7 等对手。在 BrowseComp 和前沿数学等关键项目上，它对主要竞争者建立了清晰的优势。

围绕发布也存在一些争议。OpenAI 曾在宣传材料中暗示，某竞品的高分可能得益于对评测数据的记忆，这一做法被部分开发者批评为回避问题。同时，尽管 GPT-5.5 Pro 在多数复杂任务上表现亮眼，早期评测也指出它在某些边缘场景下仍会出现不稳定现象，表现出尚待打磨的毛边。

GPT-5.5 Pro 的出现，标志着前沿 AI 的重心正从纯智力问答转向更具现实意义的自主行动。 它不再只是更聪明的对话引擎，而是一个可以交付结果的数字执行者。这种转变，也许才是这次进化背后最值得关注的信号。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送