加载中...
加载中...
GPT-5.4 mini
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
| Type | Condition | Input | Output |
|---|---|---|---|
| Text | - | $0.750/ 1M | $4.50/ 1M |
| Type | Condition | Input |
|---|
GPT-5.4 mini 是 OpenAI 于 2026 年 3 月 17 日正式发布的小型语言模型,属于 GPT-5.4 系列的轻量化变体。OpenAI 将其定位为“迄今性能最强的 mini 级模型”,旨在将 GPT-5.4 旗舰版的核心能力——包括推理、编程、多模态理解与工具调用——压缩至体积更小、速度更快的架构中,以满足高并发、低延迟工作负载的需求。其运行速度超过前代 GPT-5 mini 的 2 倍,并在多项评测中接近 GPT-5.4 旗舰版水平。
GPT-5.4 mini 的模型参数量尚未对外公开。其上下文窗口为 400,000 tokens,支持在单次会话中处理大型代码库、长文档及多轮复杂交互。官方公布的知识截止日期为 2025 年 8 月 31 日。训练数据的具体构成未予披露。该模型支持可配置的推理强度(reasoning_effort)参数,最高可设置为“high”。
GPT-5.4 mini 支持文本与图像的多模态输入,输出为纯文本。通过 API 访问时,该模型支持工具调用(Tool Use)、函数调用(Function Calling)、网络搜索(Web Search)、文件搜索(File Search)、计算机使用(Computer Use)以及技能(Skills)调用。在计算机使用场景中,模型能够快速解析密集用户界面的截图并执行相应操作,是高响应速度多模态应用的理想选择。
根据 OpenAI 公布的官方基准数据(均在 high 推理强度下完成),GPT-5.4 mini 在代码生成基准 SWE-Bench Pro 上得分为 54.38%,落后于旗舰版 GPT-5.4 约 3 个百分点;在计算机操控基准 OSWorld-Verified 上得分为 72.13%,接近旗舰版 75.03%,并超越人类基线 72.4%。在同等延迟条件下,mini 持续优于 GPT-5 mini,展现出该性能区间最优的延迟-性能比之一。
OpenAI 推荐将 GPT-5.4 mini 用于以下典型场景:需要低延迟反馈的代码助手(如代码编辑、代码库导航、前端生成和调试循环);多代理系统中的子代理角色(负责代码搜索、文件审查等支撑性任务);涉及实时截图解析的计算机使用类应用;以及需要对图像进行实时推理的多模态应用。在 OpenAI Codex 中,mini 仅消耗 GPT-5.4 配额的 30%,约为旗舰版成本的三分之一。对于需要深度多步骤规划或最高精度输出的任务,官方仍推荐选用 GPT-5.4 旗舰版。
GPT-5.4 mini 通过 OpenAI API、Codex 应用(含 CLI、IDE 扩展和 Web 端)以及 ChatGPT 向用户开放。在 ChatGPT 中,免费(Free)和 Go 层级用户可通过”+“菜单的“Thinking”功能访问;其余付费用户在达到 GPT-5.4 速率上限时,系统将自动回退至 GPT-5.4 mini。API 按 token 计费:标准输入 $0.75/百万 token,缓存输入 $0.075/百万 token,输出 $4.50/百万 token;数据驻留(Data Residency)地区端点额外加收 10%。模型为闭源,不提供开源权重。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

| Output |
|---|
| Text | - | $0.375/ 1M | $2.25/ 1M |
| Text | Cache = 5 min | $0.038/ 1M | $2.25/ 1M |
| Type | TTL | Write | Read |
|---|---|---|---|
| Text | 5m | $0.075/ 1M | $4.50/ 1M |