GPT-5.4

Name: GPT-5.4
Price: 2.5 USD
Availability: InStock
Author: OpenAI

多模态大模型

GPT-5.4

发布时间: 2026-03-05更新于: 2026-03-29 20:40:32.669知识截止: 2025-082,161

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

中文支持

支持

推理能力

GPT-5.4 是 OpenAI 于 2026 年 3 月发布的多模态大型语言模型，属于 GPT-5 系列迭代版本。该模型面向复杂知识工作、软件工程辅助与长上下文分析场景，支持最高 1M tokens 的超长上下文窗口，并提供思考（Thinking）与 Pro 多个配置变体。在主要评测基准中，GPT-5.4 在 SWE-Bench Pro（57.70，排名第 1）、GPQA Diamond（92.80）、OSWorld-Verified（75.0，排名第 1）以及 FrontierMath（47.60）等方向具备竞争力。API 标准输入定价为 $2.50/1M tokens（272K 上下文以内），输出为 $15.00/1M tokens，通过 OpenAI API 及 ChatGPT 平台访问，模型权重不开源。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

GPT-5.4

模型基本信息

推理过程

支持

思考模式

思考水平 · 极高 (Extra-High) (默认)思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 高 (High)

上下文长度

1M tokens

最大输出长度

128000 tokens

模型类型

多模态大模型

发布时间

2026-03-05

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

0.0 亿 / 不涉及

知识截止

2025-08

GPT-5.4

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://chatgpt.com/

GPT-5.4

官方介绍与博客

官方论文

Introducing GPT‑5.4

DataLearnerAI博客

暂无介绍博客

GPT-5.4

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	上下文长度 <= 272K	$2.50/ 1M	$15.00/ 1M
文本	上下文长度 > 272K	$5.00/ 1M	$22.50/ 1M

缓存定价Prompt缓存

类型	有效期	写入	读取
文本	5m	$0.250/ 1M	-

GPT-5.4

评测结果

GPT-5.4 当前已收录的代表性评测结果包括 Pinch Bench（1 / 37，得分 90.50）、GPQA Diamond（8 / 167，得分 92.80）、ARC-AGI（3 / 55，得分 93.70）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

当前筛选暂无评测数据。

查看评测深度分析与其他模型对比

GPT-5.4

发布机构

OpenAI

查看发布机构详情

GPT-5.4

模型解读

GPT-5.4模型概述

GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT 系列大型语言模型版本之一。该模型定位为面向专业工作场景的前沿基础模型，旨在提升复杂知识任务、软件开发以及长上下文分析等场景中的能力与效率。公开报道指出，GPT-5.4 在多个能力维度上进行了优化，包括上下文处理能力、推理效率以及复杂任务完成能力。

在产品定位上，GPT-5.4 属于 GPT-5 系列的迭代版本，并在发布时提供多个不同配置的变体，包括面向推理任务的 GPT-5.4 Thinking 版本以及面向企业级生产环境的 GPT-5.4 Pro 版本。

架构与技术规格

截至目前，OpenAI 尚未公开 GPT-5.4 的完整模型架构细节，例如参数规模或训练数据规模。与 GPT 系列的其他商业模型类似，该模型采用专有架构并未开源。

公开资料表明，该模型在 API 版本中支持最高约 1,000,000 tokens 的上下文窗口，这使其能够处理远超传统语言模型的长文档输入，例如大型代码库、研究文献或长周期任务上下文。

社区分析及部分技术报道还指出，开发过程中的代码提交信息曾显示更大规模上下文窗口的实验版本，相关讨论中提到最高可能达到约 2M tokens 的实验能力，但该信息并未在官方发布文档中确认。

核心能力与支持模态

GPT-5.4 是一类多模态基础模型，能够处理文本和图像等多种输入形式。相关技术更新提到，该模型支持更高精度的图像输入处理能力，例如在 API 中支持直接传入原始图像字节进行分析，这对于需要高分辨率视觉理解的应用场景具有重要意义。

在文本能力方面，该模型针对复杂知识工作任务进行了优化，例如多步骤推理、软件开发辅助、信息检索与整合等场景。

性能与基准评测

公开报道显示，GPT-5.4 在多个内部评测任务中取得了较高表现。例如在面向知识工作任务的 GDPval 评测中取得约 83% 的成绩，并在 OSWorld-Verified 和 WebArena Verified 等计算机使用相关评测中取得新的记录成绩。

此外，官方资料指出该模型在事实性错误方面相比 GPT-5.2 有明显下降，错误率降低约 33%。

应用场景

由于其长上下文能力和多模态能力，GPT-5.4 被用于多种复杂应用场景，例如：

大型代码库理解与软件工程辅助
复杂知识工作任务与研究分析
长文档处理与信息总结
自动化任务与智能代理系统

访问方式与许可

GPT-5.4 为专有商业模型，目前主要通过 OpenAI 提供的 API 以及相关开发工具平台访问。模型权重与训练数据未公开发布。

GPT-5.4

常见问题

GPT-5.4 是什么模型，有什么特点？

GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT-5 系列多模态大语言模型，支持文本与图像输入，具备最高 1M tokens 的超长上下文窗口，并针对复杂推理、软件开发辅助和长文档分析进行了优化。

GPT-5.4 支持哪些思考模式？

GPT-5.4 支持多档思考强度设置，包括低（Low）、中（Medium）、高（High）和极高（Extra-High，默认）。思考强度越高，模型推理深度越大，适合复杂任务，但耗时和成本也相应增加。用户可根据任务复杂度灵活选择。

GPT-5.4 的主要评测成绩如何？

GPT-5.4 在 SWE-Bench Pro Public 评测中排名第 1（得分 57.70），OSWorld-Verified 排名第 1（得分 75.0），GPQA Diamond 得分 92.80，FrontierMath 得分 47.60，HLE（含工具）得分 52.10，整体在代码工程与 Agent 任务上表现突出。

GPT-5.4 的 API 价格是多少？

GPT-5.4 标准模式下，上下文 272K 以内输入价格为 $2.50/1M tokens，输出为 $15.00/1M tokens；超过 272K 上下文时输入涨至 $5.00/1M tokens，输出为 $22.50/1M tokens。支持 Prompt 缓存，写入费用为 $0.25/1M tokens。

GPT-5.4 是否开源？如何访问？

GPT-5.4 为 OpenAI 专有商业模型，模型权重与训练数据均不开源。用户可通过 OpenAI API（模型名称 gpt-5-4）或 ChatGPT 平台（chatgpt.com）访问。

GPT-5.4 支持多长的上下文？

GPT-5.4 API 版本支持最高约 1,000,000 tokens（1M tokens）的超长上下文窗口，最大输出长度为 128,000 tokens，适合处理大型代码库、长研究文献或多轮长对话等场景。

GPT-5.4 适合哪些使用场景？

GPT-5.4 适合大型代码库理解与软件工程辅助、复杂知识工作与研究分析、长文档处理与多步骤推理、以及 AI Agent 自动化任务（如计算机操作、信息检索与工具调用）等场景。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

类型

适用条件

输入

输出

文本

上下文长度 <= 272K

$2.50/ 1M

$15.00/ 1M

文本

上下文长度 > 272K

$5.00/ 1M

$22.50/ 1M

类型

有效期

写入

读取

文本

$0.250/ 1M

GPT-5.4模型概述

架构与技术规格

核心能力与支持模态

在文本能力方面，该模型针对复杂知识工作任务进行了优化，例如多步骤推理、软件开发辅助、信息检索与整合等场景。

性能与基准评测

此外，官方资料指出该模型在事实性错误方面相比 GPT-5.2 有明显下降，错误率降低约 33%。