GPT-5.5vsGPT-5.2

在 10 个共同 benchmark 中,GPT-5.5 整体领先:GPT-5.5 领先 9 项,GPT-5.2 领先 1 项,持平 0 项,平均分差 +178.94。

OpenAI
GPT-5.5

OpenAI · 2026-04-23 · 推理大模型

OpenAI
GPT-5.2

OpenAI · 2025-12-11 · 聊天大模型

GPT-5.59 (90%)(10%)1 GPT-5.2

评测分数

按能力类目分组,每组内按分差大小排列;共 10 项。

General Knowledge

GPT-5.5 领先 4/4
评测项GPT-5.5GPT-5.2分差
ARC-AGI-2851 / 59Thinking High (No Tools)54.2020 / 59深度思考(无工具、并行)+30.80
HLE52.2013 / 157Thinking High (With Tools)45.5032 / 157Deep Thinking (With Tools + Internet)+6.70
ARC-AGI953 / 65极高强度思考(无工具)90.5015 / 65深度思考(无工具、并行)+4.50
GPQA Diamond93.606 / 178Thinking High (No Tools)93.208 / 178深度思考(无工具、并行)+0.40

Math and Reasoning

GPT-5.5 领先 2/2
评测项GPT-5.5GPT-5.2分差
FrontierMath - Tier 435.407 / 80Thinking High (With Tools)18.8016 / 80Thinking High (No Tools)+16.60
FrontierMath51.702 / 60Thinking High (With Tools)40.308 / 60极高强度思考(工具)+11.40

Agent Level Benchmark

GPT-5.2 领先 1/1
评测项GPT-5.5GPT-5.2分差
τ²-Bench - Telecom985 / 35Thinking High (With Tools)98.704 / 35极高强度思考(工具)-0.70

AI Agent - Information Search

GPT-5.5 领先 1/1
评测项GPT-5.5GPT-5.2分差
BrowseComp84.405 / 45Thinking High (With Tools + Internet)65.8024 / 45Deep Thinking (With Tools + Internet)+18.60

Coding and Software Engineer

GPT-5.5 领先 1/1
评测项GPT-5.5GPT-5.2分差
SWE-Bench Pro - Public58.607 / 43Thinking High (With Tools)55.6017 / 43极高强度思考(工具)+3

Productivity Knowledge

GPT-5.5 领先 1/1
评测项GPT-5.5GPT-5.2分差
GDPval-AA1,7692 / 21Thinking High (No Tools)70.909 / 21Thinking High (With Tools)+1,698

规格对比

字段GPT-5.5GPT-5.2
发布机构OpenAIOpenAI
发布时间2026-04-232025-12-11
模型类型推理大模型聊天大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度1000K400K
最大输出128K暂无数据

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项GPT-5.5GPT-5.2
文本输入$0.5 / 1M tokens$1.75 / 1M tokens
文本输出$30 / 1M tokens$14 / 1M tokens
缓存读取$0.5 / 1M tokens$0.175 / 1M tokens
缓存写入$6.25 / 1M tokens$1.75 / 1M tokens

小结

  • GPT-5.5在以下类目领先:General Knowledge (4/4)、Math and Reasoning (2/2)、AI Agent - Information Search (1/1)、Coding and Software Engineer (1/1)、Productivity Knowledge (1/1)
  • GPT-5.2在以下类目领先:Agent Level Benchmark (1/1)

10 个共同 benchmark 上,GPT-5.5 平均高出 178.94 分。

单项差距最大的 benchmark:GDPval-AA — GPT-5.5 1,769,GPT-5.2 70.90(分差 +1,698)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。