DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面目录
目录
  1. 首页
  2. 模型对比
  3. 对比结果
DataLearnerAI · 对比结果

DataLearnerAI大模型对比结果 & 评测数据

自动展示选中模型的核心信息与各评测得分,可左右滑动查看完整表格。DataLearnerAI 基于公开网络采集与整理的模型指标与描述。 当前展示 4 个模型,左右滑动可查看更多。

Grok 4 FastGrok 4GPT-5Gemini 2.5-Pro
xAI

Grok 4 Fast

GR

Grok 4 Fast

发布时间2025-09-19
上下文2000K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
查看详情在线体验
xAI

Grok 4

GR

Grok 4

发布时间2025-07-10
上下文256K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
查看详情在线体验
OpenAI

GPT-5

GP

GPT-5

发布时间2025-08-07
上下文400K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
查看详情在线体验
Google Deep Mind

Gemini 2.5-Pro

GE

Gemini 2.5-Pro

发布时间2025-06-05
上下文1000K
参数量0
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

模式筛选

选择思考模式 / 工具使用 / 是否去除并行,更新下方柱状对比。

全部模式
快捷组合
思考模式
工具 & 并行

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

当前筛选:全部模式14 个模式 · 6 项评测
图表加载中...

综合最佳

当前筛选下的平均得分领先

Grok 4 · 平均 75.85

单项最强

单个评测的最高得分

GPT-5 在 AIME2025 中拿到 99.60

思考模式

当前筛选下的推理/思考模式覆盖

GPT-5 · 4 个思考/深度模式

评测得分表格

完整列出各模型/模式的评测得分,便于横向比较。

评测得分表格

评测基准对比

直观查看各模型/模式在每个评测基准上的得分。

6 项评测14 个模式
模型评测模式说明:常规模式思考模式深思模式使用工具并行/多智能体
评测基准
GR
Grok 4 FastxAI
GR
Grok 4xAI
GP
GPT-5OpenAI
GE
Gemini 2.5-ProGoogle Deep Mind
综合评估
GPQA Diamond
—85.70——87.00——77.8085.70——87.30—86.40
HLE
—20.00——25.4038.6038.606.30——24.8035.20—21.60
LiveBench
68.09——72.84————79.3378.85———71.92
常识问答
SimpleQA
——95.00—————————54.00—
编程与软件工程
LiveCodeBench
—80.00——82.00———————77.10—
数学推理
AIME2025
—92.00——91.7098.80—61.90——94.6099.60—88.00

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格
GR
Grok 4 FastxAI
GR
Grok 4xAI
GP
GPT-5OpenAI
GE
Gemini 2.5-ProGoogle Deep Mind

模型信息卡片

开发机构
xAIxAIOpenAIGoogle Deep Mind
模型全名
Grok 4 FastGrok 4GPT-5Gemini 2.5-Pro
模型简介
未提供未提供未提供未提供
模型类型
聊天大模型推理大模型基础大模型推理大模型
模型代号
Grok-4-Fastgrok-4gpt-5gemini-2_5-pro-preview-06-05
发布时间
2025-09-192025-07-102025-08-072025-06-05
MoE 架构
不支持不支持不支持不支持

规格与性能

上下文
2000K256K400K1000K
参数量
————
激活参数量
未提供未提供未提供未提供
模型规模
未知未知未知未知
模型大小
未提供未提供未提供未提供
推理速度
推理等级
最大输出
409626214413107265536
支持模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)

开源与许可

代码开源
未提供未提供未提供未提供
权重开源
未提供未提供未提供未提供
商业授权
不开源不开源不开源不开源

模态支持

文本 输入/输出
/
/
/
/
图片 输入/输出
/
/
/
/
音频 输入/输出
/
/
/
/
视频 输入/输出
/
/
/
/
Embedding 输入/输出
/
/
/
/

API 接口详情

文本 价格
输入:0.2 美元/100万 tokens输出:0.5 美元/100万 tokens
输入:3 美元/100 万tokens输出:15 美元/100 万tokens
输入:1.25 美元/100 万tokens输出:10 美元/100 万tokens
输入:1.25 美元/100 万tokens输出:10 美元/100 万tokens缓存价:0.125 美元/100 万tokens输入超长:2.5 美元/100 万tokens输出超长:15 美元/100 万tokens超长阈值:200K
图片 价格
输入:0.2 美元/100万 tokens
输入:3 美元/100 万tokens
未提供
输入:1.25 美元/100 万tokens缓存价:0.125 美元/100 万tokens
音频 价格
未提供未提供未提供未提供
视频 价格
未提供未提供未提供未提供
Embedding 价格
未提供未提供未提供未提供

资源与链接

GitHub
未提供未提供未提供未提供
Hugging Face
未提供未提供未提供未提供
官方页面
未提供未提供未提供未提供
实用指南
未提供未提供未提供未提供
论文/报告
Grok 4 Fast Pushing the Frontier of Cost-Efficient IntelligenceGrok 4Introducing GPT-5Try the latest Gemini 2.5 Pro before general availability.
DataLearnerAI 博客
大模型速度、效果与价格的完美结合?xAI发布Grok 4 Fast:性能接近Grok 4,成本降 98%,生成速度翻倍!AIME 2025满分,xAI正式发布Grok模型,其中Grok 4 Heavy评测超越当前所有大模型,美国数学竞赛满分!一年3000美元订阅费!OpenAI发布GPT-5:这是一个包含实时路由的AI系统,而不仅仅是一个模型Google发布Gemini 2.5 Pro: Gemini系列第一个2.5版本的模型,最高支持200万上下文,全模态输入,推理大模型,LMArena排名第一

API 价格

API 价格对比

输入输出 token 价格并排展示

模型数据收集自官网、Artificial Analysis等页面