GPT-5.4
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的多模态大型语言模型,属于 GPT-5 系列迭代版本。该模型面向复杂知识工作、软件工程辅助与长上下文分析场景,支持最高 1M tokens 的超长上下文窗口,并提供思考(Thinking)与 Pro 多个配置变体。在主要评测基准中,GPT-5.4 在 SWE-Bench Pro(57.70,排名第 1)、GPQA Diamond(92.80)、OSWorld-Verified(75.0,排名第 1)以及 FrontierMath(47.60)等方向具备竞争力。API 标准输入定价为 $2.50/1M tokens(272K 上下文以内),输出为 $15.00/1M tokens,通过 OpenAI API 及 ChatGPT 平台访问,模型权重不开源。
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Model basics
Open source & experience
Official resources
API details
| Type | Condition | Input | Output |
|---|---|---|---|
| Text | Context <= 272K | $2.50/ 1M | $15.00/ 1M |
| Text | Context > 272K | $5.00/ 1M | $22.50/ 1M |
| Type | TTL | Write | Read |
|---|---|---|---|
| Text | 5m | $0.250/ 1M | - |
Benchmark Results
GPT-5.4 currently shows benchmark results led by LiveBench (2 / 115, score 80.28), Pinch Bench (1 / 37, score 90.50), GPQA Diamond (10 / 179, score 92.80). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.
General Knowledge
14 evaluationsMath and Reasoning
2 evaluationsCoding and Software Engineer
2 evaluationsAgent Level Benchmark
2 evaluationsAI Agent - Tool Usage
3 evaluationsClaw-style Agent Evaluation
2 evaluationsCompare with other models
Publisher
Model Overview
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的多模态大型语言模型,属于 GPT-5 系列迭代版本。该模型面向复杂知识工作、软件工程辅助与长上下文分析场景,支持最高 1M tokens 的超长上下文窗口,并提供思考(Thinking)与 Pro 多个配置变体。在主要评测基准中,GPT-5.4 在 SWE-Bench Pro(57.70,排名第 1)、GPQA Diamond(92.80)、OSWorld-Verified(75.0,排名第 1)以及 FrontierMath(47.60)等方向具备竞争力。API 标准输入定价为 $2.50/1M tokens(272K 上下文以内),输出为 $15.00/1M tokens,通过 OpenAI API 及 ChatGPT 平台访问,模型权重不开源。
DataLearner on WeChat
Follow DataLearner on WeChat for AI model updates and research notes.
