DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GPT-5.5 Pro
GP

GPT-5.5 Pro

推理大模型

GPT-5.5 Pro

发布时间: 2026-04-23更新于: 2026-04-28 10:54:58.708254
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1000K
中文支持
支持
推理能力

GPT-5.5 Pro 是由 OpenAI 发布的 AI 模型,发布时间为 2026-04-23,定位为 推理大模型,参数规模约为 0.0B,上下文长度为 1000K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-5.5 Pro

模型基本信息

推理过程
支持
思考模式
思考水平 · 高 (High) (默认)思考水平 · 中 (Medium)思考水平 · 极高 (Extra-High)
上下文长度
1000K tokens
最大输出长度
131072 tokens
模型类型
推理大模型
发布时间
2026-04-23
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
GPT-5.5 Pro

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://chatgpt.com/
GPT-5.5 Pro

官方介绍与博客

官方论文
Introducing GPT‑5.5
DataLearnerAI博客
OpenAI 发布 GPT-5.5:代号
GPT-5.5 Pro

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
了解不同定价模式详解
标准模式
类型适用条件输入输出
文本-$30.00/ 1M$180.00/ 1M
GPT-5.5 Pro

评测结果

GPT-5.5 Pro 当前已收录的代表性评测结果包括 FrontierMath - Tier 4(1 / 80,得分 39.60)、ARC-AGI(1 / 65,得分 96.50)、FrontierMath(1 / 60,得分 52.40)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
工具使用
全部使用工具不使用工具
联网能力
全部离线联网

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
极高工具联网
90.10
1 / 43
查看评测深度分析与其他模型对比
GPT-5.5 Pro

发布机构

OpenAI
OpenAI
查看发布机构详情
GPT-5.5 Pro

模型解读

2026年4月23日,OpenAI 正式推出了 GPT-5.5 系列模型,其中包括标准版 GPT-5.5 以及性能更强的高阶版本 GPT-5.5 Pro。标准版已展现出全面领先的基础智能,而本文的主角——GPT-5.5 Pro——则被设计为一个真正面向复杂工作场景的智能体模型。它不再满足于被动应答,而是能够自主规划任务、调用工具、校验执行结果,并在模糊与歧义中持续做出正确判断。该模型目前仅向 Pro、Business 和 Enterprise 订阅用户开放。


不止更聪明,还更省资源

GPT-5.5 Pro 最直观的进化体现在效率上。通过和英伟达硬件协同设计,它在保持与上代相近单 Token 延迟的前提下,将生成速度提升了超过 20%。更关键的是,在完成同一项 Codex 编码任务时,整个 GPT-5.5 系列消耗的 Token 数量大幅减少,这意味着 GPT-5.5 Pro 能真正做到花更少的计算资源办更难的事。

基准测试中的绝对领先

GPT-5.5 Pro 在广泛的智力评测中确立了优势,尤其在需要深度推理和长时间规划的项目上,拉开了与标准版 GPT-5.5 的差距。

评测基准核心考察能力GPT-5.5 得分GPT-5.5 Pro 得分

BrowseComp浏览与复杂信息理解84.4%90.1%

FrontierMath Tier 4高难度数学推理35.4%39.6%

GDPval跨44种知识职业的知识工作84.9%82.3%

SWE-Bench Pro真实 GitHub 问题解决58.6%-

Terminal-Bench 2.0复杂命令行任务82.7%-

在 BrowseComp 和 FrontierMath 这类对推理连贯性要求极高的测试中,GPT-5.5 Pro 取得了对标准版的显著领先,在知识工作评测 GDPval 上也保持着一流水准。

专业深水区的表现

GPT-5.5 Pro 能够深入专业研究腹地。在评测生物信息学能力的 BixBench 上,它拿到了 80.5% 的分数,为所有已知公开成绩中的最高水平。数学方面,一个内部版本的模型成功证明了一项关于 Ramsey 数的长期猜想,并用证明助手 Lean 完成了形式化验证。网络安全领域,GPT-5.5 Pro 在 CyberGym 基准中得到 81.8% 的分数,远超过 Claude 4.7 的 73.1%。

开发者的新大脑

GPT-5.5 Pro 的编码能力获得了早期体验者一边倒的认可。它能整体把握大型代码库的结构,主动预判潜在的架构隐患,甚至独立给出足以媲美资深工程师的系统重构方案。有多位测试者形容,一旦用惯了这种深度协作,失去访问权限会产生强烈的缺失感。一些开发工具平台的负责人也公开表示,该模型在长达数小时的复杂任务中展现出的韧性令人印象深刻。

定价与访问方式

GPT-5.5 Pro 的 API 价格为每百万输入 Token 30 美元,每百万输出 Token 180 美元,接近标准版 GPT-5.5 输出价格的 6 倍。模型随 ChatGPT 和 Codex 向 Pro、Business、Enterprise 用户分批推送,支持高达 100 万 Token 的超长上下文窗口,足以一次性消化数千页技术文档。

面向风险重新设计的安全体系

OpenAI 按照其 Preparedness Framework 对 GPT-5.5 系列进行了严格评估,并将该模型在生物、化学及网络安全方向的潜在能力评定为 High 等级。相应地,GPT-5.5 Pro 部署了被内部称为迄今最强的一整套安全防护机制,尤其加强了对高风险网络操作请求的审查与遏制。

竞争格局与争议

第三方机构 Artificial Analysis 的综合智能指数榜单上,GPT-5.5 系列直接占据前两位,GPT-5.5 Pro 力压 Anthropic 的 Claude Opus 4.7 等对手。在 BrowseComp 和前沿数学等关键项目上,它对主要竞争者建立了清晰的优势。

围绕发布也存在一些争议。OpenAI 曾在宣传材料中暗示,某竞品的高分可能得益于对评测数据的记忆,这一做法被部分开发者批评为回避问题。同时,尽管 GPT-5.5 Pro 在多数复杂任务上表现亮眼,早期评测也指出它在某些边缘场景下仍会出现不稳定现象,表现出尚待打磨的毛边。


GPT-5.5 Pro 的出现,标志着前沿 AI 的重心正从纯智力问答转向更具现实意义的自主行动。 它不再只是更聪明的对话引擎,而是一个可以交付结果的数字执行者。这种转变,也许才是这次进化背后最值得关注的信号。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码