See key specs and per-benchmark scores for each model/mode. Scroll horizontally for all columns. 当前对比 3 个模型的评测数据与核心参数。
2025年夏季发布的三款顶级大模型GPT-5、Gemini-2.5-Pro和Grok 4均为非开源的商业模型。然而,在具体能力和市场定位上,三者展现出鲜明的差异化策略。从评测结果来看,GPT-5在多项指标上表现均衡,Gemini-2.5-Pro凭借其高达100万tokens的上下文窗口,在处理超长文本方面独占鳌头;Grok 4则以其强大的综合评估能力和知识广度见长。
以下是基于数据对比得出的几点核心结论:
此外,GPT-5与Gemini-2.5-Pro的API定价完全一致,显示出OpenAI和Google DeepMind在争夺广大开发者和企业客户市场上的激烈竞争。而Grok 4的输入价格(3美元/百万tokens)和输出价格(15美元/百万tokens)显著高于前两者。
综合来看,GPT-5在通用性与稳定性上占据优势,适合作为通用 AI 服务的核心模型;Gemini-2.5-Pro上下文规模大但表现不均,更偏向长文本处理与特定任务;Grok 4在部分推理任务中表现突出,但成本与适用范围需权衡。
GPT-5
Grok 4
Gemini 2.5-Pro
Compare benchmark results across thinking modes and tool usage.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Best Overall
—
Best Single
—
Thinking Mode (Default)
Grok 4 · 2 Modality support
Higher is usually better; “—” means no score.
Complete scores for each model/mode across selected benchmarks.
Feature compare
Licensing, MoE architecture, and multi-modality support.
| Features & specs | GP GPT-5OpenAI | GR Grok 4xAI | GE Gemini 2.5-ProGoogle Deep Mind |
|---|---|---|---|
Model snapshots | |||
Organization | OpenAI | xAI | Google Deep Mind |
模型全名 | GPT-5 | Grok 4 | Gemini 2.5-Pro |
模型简介 | Not provided | Not provided | Not provided |
模型类型 | 基础大模型 | 推理大模型 | 推理大模型 |
模型代号 | gpt-5 | grok-4 | gemini-2_5-pro-preview-06-05 |
Release | 2025-08-07 | 2025-07-10 | 2025-06-05 |
MoE | No | No | No |
规格与性能 | |||
Context length | 400K | 256K | 1000K |
Parameters | — | — | — |
激活参数量 | Not provided | Not provided | Not provided |
模型规模 | 未知 | 未知 | 未知 |
模型大小 | Not provided | Not provided | Not provided |
推理速度 | |||
推理等级 | |||
最大输出 | 131072 | 262144 | 65536 |
Supported modes | 常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode) | 常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode) | 常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode) |
开源与许可 | |||
Code Open Source | Not provided | Not provided | Not provided |
Weights Open Source | Not provided | Not provided | Not provided |
Commercial use | 不开源 | 不开源 | 不开源 |
Modality support | |||
Text Input/Output | / | / | / |
Image Input/Output | / | / | / |
Audio Input/Output | / | / | / |
Video Input/Output | / | / | / |
Embedding Input/Output | / | / | / |
API 接口详情 | |||
Text 价格 | Input: 1.25 美元/100 万tokensOutput: 10 美元/100 万tokens | Input: 3 美元/100 万tokensOutput: 15 美元/100 万tokens | Input: 1.25 美元/100 万tokensOutput: 10 美元/100 万tokensCache: 0.125 美元/100 万tokensInput (Extended): 2.5 美元/100 万tokensOutput (Extended): 15 美元/100 万tokensThreshold: 200K |
Image API pricing | Not provided | Input: 3 美元/100 万tokens | Input: 1.25 美元/100 万tokensCache: 0.125 美元/100 万tokens |
Audio API pricing | Not provided | Not provided | Not provided |
Video API pricing | Not provided | Not provided | Not provided |
Embedding API pricing | Not provided | Not provided | Not provided |
Resources | |||
GitHub | Not provided | Not provided | Not provided |
Hugging Face | Not provided | Not provided | Not provided |
Official Page | Not provided | Not provided | Not provided |
Guides | Not provided | Not provided | Not provided |
Papers | Introducing GPT-5 | Grok 4 | Try the latest Gemini 2.5 Pro before general availability. |
DataLearnerAI | OpenAI发布GPT-5:这是一个包含实时路由的AI系统,而不仅仅是一个模型 | AIME 2025满分,xAI正式发布Grok模型,其中Grok 4 Heavy评测超越当前所有大模型,美国数学竞赛满分!一年3000美元订阅费! | Google发布Gemini 2.5 Pro: Gemini系列第一个2.5版本的模型,最高支持200万上下文,全模态输入,推理大模型,LMArena排名第一 |
API pricing
Side-by-side input/output token pricing