GPT-5.2 ProvsOpus 4.5

在 5 个共同 benchmark 中,GPT-5.2 Pro 整体领先:GPT-5.2 Pro 领先 5 项,Opus 4.5 领先 0 项,持平 0 项,平均分差 +13.44。

OpenAI
GPT-5.2 Pro

OpenAI · 2025-12-11 · 推理大模型

Anthropic
Opus 4.5

Anthropic · 2025-11-25 · 推理大模型

GPT-5.2 Pro5 (100%)(0%)0 Opus 4.5

评测分数

按能力类目分组,每组内按分差大小排列;共 5 项。

General Knowledge

GPT-5.2 Pro 领先 4/4
评测项GPT-5.2 ProOpus 4.5分差
ARC-AGI-254.2020 / 5937.6026 / 59Extended (no tools)+16.60
ARC-AGI90.5015 / 658021 / 65Extended (no tools)+10.50
HLE5022 / 15743.2039 / 157Extended (with tools)+6.80
GPQA Diamond93.208 / 1788738 / 178Extended (no tools)+6.20

Math and Reasoning

GPT-5.2 Pro 领先 1/1
评测项GPT-5.2 ProOpus 4.5分差
FrontierMath - Tier 431.309 / 804.2040 / 80Normal (No Tools)+27.10

规格对比

字段GPT-5.2 ProOpus 4.5
发布机构OpenAIAnthropic
发布时间2025-12-112025-11-25
模型类型推理大模型推理大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度256K200K
最大输出暂无数据64K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项GPT-5.2 ProOpus 4.5
文本输入暂无公开价格$5 / 1M tokens
文本输出暂无公开价格$25 / 1M tokens
缓存读取暂无公开价格$0.5 / 1M tokens
缓存写入暂无公开价格$6.25 / 1M tokens

部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。

小结

  • GPT-5.2 Pro在以下类目领先:General Knowledge (4/4)、Math and Reasoning (1/1)

5 个共同 benchmark 上,GPT-5.2 Pro 平均高出 13.44 分。

单项差距最大的 benchmark:FrontierMath - Tier 4 — GPT-5.2 Pro 31.30,Opus 4.5 4.20(分差 +27.10)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。