DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GPT-5.4
GP

GPT-5.4

GPT-5.4

发布时间: 2026-03-05更新于: 2026-03-10 08:31:15知识截止: 2025-08521
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
1M
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-5.4

模型基本信息

推理过程
支持
思考模式
思考水平 · 极高 (Extra-High) (默认)思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 高 (High)
上下文长度
1M tokens
最大输出长度
128000 tokens
模型类型
多模态大模型
发布时间
2026-03-05
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
2025-08
GPT-5.4

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://chatgpt.com/
GPT-5.4

官方介绍与博客

官方论文
Introducing GPT‑5.4
DataLearnerAI博客
暂无介绍博客
GPT-5.4

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
了解不同定价模式详解
标准模式
类型适用条件输入输出
文本上下文长度 <= 272K$2.50/ 1M$15.00/ 1M
文本上下文长度 > 272K$5.00/ 1M$22.50/ 1M
缓存定价Prompt缓存
类型有效期写入读取
文本5m$0.250/ 1M-
GPT-5.4

评测结果

GPT-5.4 当前已收录的代表性评测结果包括 HLE(3 / 113,得分 52.10)、GPQA Diamond(6 / 160,得分 92.80)、SWE-Bench Pro - Public(1 / 19,得分 57.70)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考
思考模式细分 (4)
全部默认 (极高)中高低
工具使用
全部使用工具不使用工具

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
HLE
极高使用工具
52.10
3 / 113

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
极高使用工具
98.90
3 / 33

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
极高使用工具
82.70
6 / 32

AI Agent - 工具使用

共 2 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
极高使用工具
75.10
2 / 26
OSWorld-Verified
极高使用工具
75
1 / 10
查看评测深度分析与其他模型对比
GPT-5.4

发布机构

OpenAI
OpenAI
查看发布机构详情
GPT-5.4

模型解读

GPT-5.4模型概述

GPT-5.4 是 OpenAI 于 2026 年 3 月发布的 GPT 系列大型语言模型版本之一。该模型定位为面向专业工作场景的前沿基础模型,旨在提升复杂知识任务、软件开发以及长上下文分析等场景中的能力与效率。公开报道指出,GPT-5.4 在多个能力维度上进行了优化,包括上下文处理能力、推理效率以及复杂任务完成能力。

在产品定位上,GPT-5.4 属于 GPT-5 系列的迭代版本,并在发布时提供多个不同配置的变体,包括面向推理任务的 GPT-5.4 Thinking 版本以及面向企业级生产环境的 GPT-5.4 Pro 版本。

架构与技术规格

截至目前,OpenAI 尚未公开 GPT-5.4 的完整模型架构细节,例如参数规模或训练数据规模。与 GPT 系列的其他商业模型类似,该模型采用专有架构并未开源。

公开资料表明,该模型在 API 版本中支持最高约 1,000,000 tokens 的上下文窗口,这使其能够处理远超传统语言模型的长文档输入,例如大型代码库、研究文献或长周期任务上下文。

社区分析及部分技术报道还指出,开发过程中的代码提交信息曾显示更大规模上下文窗口的实验版本,相关讨论中提到最高可能达到约 2M tokens 的实验能力,但该信息并未在官方发布文档中确认。

核心能力与支持模态

GPT-5.4 是一类多模态基础模型,能够处理文本和图像等多种输入形式。相关技术更新提到,该模型支持更高精度的图像输入处理能力,例如在 API 中支持直接传入原始图像字节进行分析,这对于需要高分辨率视觉理解的应用场景具有重要意义。

在文本能力方面,该模型针对复杂知识工作任务进行了优化,例如多步骤推理、软件开发辅助、信息检索与整合等场景。

性能与基准评测

公开报道显示,GPT-5.4 在多个内部评测任务中取得了较高表现。例如在面向知识工作任务的 GDPval 评测中取得约 83% 的成绩,并在 OSWorld-Verified 和 WebArena Verified 等计算机使用相关评测中取得新的记录成绩。

此外,官方资料指出该模型在事实性错误方面相比 GPT-5.2 有明显下降,错误率降低约 33%。

应用场景

由于其长上下文能力和多模态能力,GPT-5.4 被用于多种复杂应用场景,例如:

  • 大型代码库理解与软件工程辅助
  • 复杂知识工作任务与研究分析
  • 长文档处理与信息总结
  • 自动化任务与智能代理系统

访问方式与许可

GPT-5.4 为专有商业模型,目前主要通过 OpenAI 提供的 API 以及相关开发工具平台访问。模型权重与训练数据未公开发布。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码