GPT-5.4 是什么模型,有什么特点?
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT-5 系列多模态大语言模型,支持文本与图像输入,具备最高 1M tokens 的超长上下文窗口,并针对复杂推理、软件开发辅助和长文档分析进行了优化。
GPT-5.4
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的多模态大型语言模型,属于 GPT-5 系列迭代版本。该模型面向复杂知识工作、软件工程辅助与长上下文分析场景,支持最高 1M tokens 的超长上下文窗口,并提供思考(Thinking)与 Pro 多个配置变体。在主要评测基准中,GPT-5.4 在 SWE-Bench Pro(57.70,排名第 1)、GPQA Diamond(92.80)、OSWorld-Verified(75.0,排名第 1)以及 FrontierMath(47.60)等方向具备竞争力。API 标准输入定价为 $2.50/1M tokens(272K 上下文以内),输出为 $15.00/1M tokens,通过 OpenAI API 及 ChatGPT 平台访问,模型权重不开源。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 文本 | 上下文长度 <= 272K | $2.50/ 1M | $15.00/ 1M |
| 文本 | 上下文长度 > 272K | $5.00/ 1M | $22.50/ 1M |
| 类型 | 有效期 | 写入 | 读取 |
|---|---|---|---|
| 文本 | 5m | $0.250/ 1M | - |
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT 系列大型语言模型版本之一。该模型定位为面向专业工作场景的前沿基础模型,旨在提升复杂知识任务、软件开发以及长上下文分析等场景中的能力与效率。公开报道指出,GPT-5.4 在多个能力维度上进行了优化,包括上下文处理能力、推理效率以及复杂任务完成能力。
在产品定位上,GPT-5.4 属于 GPT-5 系列的迭代版本,并在发布时提供多个不同配置的变体,包括面向推理任务的 GPT-5.4 Thinking 版本以及面向企业级生产环境的 GPT-5.4 Pro 版本。
截至目前,OpenAI 尚未公开 GPT-5.4 的完整模型架构细节,例如参数规模或训练数据规模。与 GPT 系列的其他商业模型类似,该模型采用专有架构并未开源。
公开资料表明,该模型在 API 版本中支持最高约 1,000,000 tokens 的上下文窗口,这使其能够处理远超传统语言模型的长文档输入,例如大型代码库、研究文献或长周期任务上下文。
社区分析及部分技术报道还指出,开发过程中的代码提交信息曾显示更大规模上下文窗口的实验版本,相关讨论中提到最高可能达到约 2M tokens 的实验能力,但该信息并未在官方发布文档中确认。
GPT-5.4 是一类多模态基础模型,能够处理文本和图像等多种输入形式。相关技术更新提到,该模型支持更高精度的图像输入处理能力,例如在 API 中支持直接传入原始图像字节进行分析,这对于需要高分辨率视觉理解的应用场景具有重要意义。
在文本能力方面,该模型针对复杂知识工作任务进行了优化,例如多步骤推理、软件开发辅助、信息检索与整合等场景。
公开报道显示,GPT-5.4 在多个内部评测任务中取得了较高表现。例如在面向知识工作任务的 GDPval 评测中取得约 83% 的成绩,并在 OSWorld-Verified 和 WebArena Verified 等计算机使用相关评测中取得新的记录成绩。
此外,官方资料指出该模型在事实性错误方面相比 GPT-5.2 有明显下降,错误率降低约 33%。
由于其长上下文能力和多模态能力,GPT-5.4 被用于多种复杂应用场景,例如:
GPT-5.4 为专有商业模型,目前主要通过 OpenAI 提供的 API 以及相关开发工具平台访问。模型权重与训练数据未公开发布。
GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT-5 系列多模态大语言模型,支持文本与图像输入,具备最高 1M tokens 的超长上下文窗口,并针对复杂推理、软件开发辅助和长文档分析进行了优化。
GPT-5.4 支持多档思考强度设置,包括低(Low)、中(Medium)、高(High)和极高(Extra-High,默认)。思考强度越高,模型推理深度越大,适合复杂任务,但耗时和成本也相应增加。用户可根据任务复杂度灵活选择。
GPT-5.4 在 SWE-Bench Pro Public 评测中排名第 1(得分 57.70),OSWorld-Verified 排名第 1(得分 75.0),GPQA Diamond 得分 92.80,FrontierMath 得分 47.60,HLE(含工具)得分 52.10,整体在代码工程与 Agent 任务上表现突出。
GPT-5.4 标准模式下,上下文 272K 以内输入价格为 $2.50/1M tokens,输出为 $15.00/1M tokens;超过 272K 上下文时输入涨至 $5.00/1M tokens,输出为 $22.50/1M tokens。支持 Prompt 缓存,写入费用为 $0.25/1M tokens。
GPT-5.4 为 OpenAI 专有商业模型,模型权重与训练数据均不开源。用户可通过 OpenAI API(模型名称 gpt-5-4)或 ChatGPT 平台(chatgpt.com)访问。
GPT-5.4 API 版本支持最高约 1,000,000 tokens(1M tokens)的超长上下文窗口,最大输出长度为 128,000 tokens,适合处理大型代码库、长研究文献或多轮长对话等场景。
GPT-5.4 适合大型代码库理解与软件工程辅助、复杂知识工作与研究分析、长文档处理与多步骤推理、以及 AI Agent 自动化任务(如计算机操作、信息检索与工具调用)等场景。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
