GPT-5vsGPT-4.5

在 4 个共同 benchmark 中，GPT-5 整体领先：GPT-5 领先 4 项，GPT-4.5 领先 0 项，持平 0 项，平均分差 +29。

OpenAI · 2025-08-07 · 基础大模型

OpenAI · 2025-02-28 · 聊天大模型

GPT-54 项(100%)(0%)0 项GPT-4.5

评测分数

按能力类目分组，每组内按分差大小排列；共 4 项。

GPT-5 领先 1/1

评测项	GPT-5	GPT-4.5	分差
Aider-Polyglot	881 / 59Thinking High (No Tools)	44.9037 / 59Normal (No Tools)	+43.10

GPT-5 领先 1/1

评测项	GPT-5	GPT-4.5	分差
SWE-bench Verified	72.8050 / 112	38104 / 112	+34.80

GPT-5 领先 1/1

评测项	GPT-5	GPT-4.5	分差
GPQA Diamond	87.3040 / 187	71.40111 / 187	+15.90

GPT-5 领先 1/1

评测项	GPT-5	GPT-4.5	分差
Simple Bench	56.7020 / 63Thinking High (No Tools)	34.5046 / 63Normal (No Tools)	+22.20

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

部分模型公开价格不完整，缺失字段按"暂无公开价格"展示。

GPT-5在以下类目领先:Agent Level Benchmark (1/1)、Coding and Software Engineer (1/1)、General Knowledge (1/1)、常识推理 (1/1)

4 个共同 benchmark 上，GPT-5 平均高出 29 分。

单项差距最大的 benchmark：Aider-Polyglot — GPT-5 88，GPT-4.5 44.90（分差 +43.10）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。