评测结果
GPT-5.5 Pro
评测结果
综合评估
共 6 项评测评测名称 / 模式
得分
排名/总数
数学推理
共 4 项评测评测名称 / 模式
得分
排名/总数
竞品对比
GPT-5.5 Pro 与同类主流模型的评测得分对比
GPT-5.5 ProClaude Mythos Preview
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;百分制评测使用原始高度,超出 0-100 的评测按该评测内相对比例缩放,标签仍保留原始分数。
2 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。
| 评测项 | GPT-5.5 Pro当前 | Claude Mythos Preview |
|---|---|---|
HLE 综合评估 | 57.20思考水平·极高 | 工具 | 64.70扩展思考 | 工具 |
BrowseComp AI Agent - 信息收集 | 90.10深度思考模式 | 工具 | 84.90扩展思考 | 工具 |
GPT-5.5 Pro 与同类模型的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。 · USD / 1M tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
GPT-5.5 Pro | OpenAI | $30 / 1M tokens | $180 / 1M tokens | — |
Claude Mythos Preview | Anthropic | $25 / 1M tokens | $125 / 1M tokens | — |
历代版本对比
GPT-5.5 Pro 系列各版本的评测成绩纵向对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;百分制评测使用原始高度,超出 0-100 的评测按该评测内相对比例缩放,标签仍保留原始分数。
7 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。· 点击任意行可切换下方趋势图。
| 评测项 | GPT-5.5 Pro当前 | GPT-5.4 Pro | GPT-5.2 Pro |
|---|---|---|---|
ARC-AGI 综合评估 | 96.50思考水平·高 | 94.50思考水平·高 | 90.50开启思考 |
ARC-AGI-2 综合评估 | 84.60思考水平·高 | 83.30思考水平·高 | 54.20开启思考 |
HLE 综合评估 | 57.20思考水平·极高 | 工具 | 58.70思考水平·高 | 工具 | 50.00开启思考 | 工具 |
FrontierMath 数学推理 | 52.40思考水平·极高 | 工具 | 50.00思考水平·极高 | -- |
39.60思考水平·极高 | 工具 | 38.00思考水平·高 | 31.30开启思考 | |
BrowseComp AI Agent - 信息收集 | 90.10深度思考模式 | 工具 | 89.30思考水平·高 | 工具 | 77.90开启思考 | 工具 |
GDPval-AA 生产力知识 | 82.30思考水平·极高 | 82.00思考水平·高 | 工具 | -- |
单评测历史趋势图
当前查看:ARC-AGI · 综合评估
选择评测
GPT-5.5 Pro 所在系列的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。 · USD / 1M tokens
若存在上下文阈值,图中标准价仅适用于以下范围:
GPT-5.4 Pro: 标准价适用于 <= 272K
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
GPT-5.5 Pro | OpenAI | $30 / 1M tokens | $180 / 1M tokens | — |
GPT-5.4 Pro | OpenAI | $30 / 1M tokens | $180 / 1M tokens | <= 272K |
GPT-5.2 Pro | — | $21.00 / 1M tokens | $168.00 / 1M tokens | — |