GR

Grok 4

推理大模型Grok 4

Grok 4

发布时间: 2025-07-10更新于: 2025-08-09 22:51:233,142

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

256K

中文支持

支持

推理能力

Grok 4 是由 xAI 发布的 AI 模型，发布时间为 2025-07-10，定位为推理大模型，上下文长度为 256K，采用不开源许可，在 AIME2025 上取得 98.80 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Grok 4

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

256K tokens

最大输出长度

256K tokens

模型类型

推理大模型

输入/输出模态

文本、图像 → 文本

发布时间

2025-07-10

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Grok 4

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://grok.com/

Grok 4

官方介绍与博客

官方论文

DataLearnerAI博客

AIME 2025满分，xAI正式发布Grok模型，其中Grok 4 Heavy评测超越当前所有大模型，美国数学竞赛满分！一年3000美元订阅费！

Grok 4

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

Grok 4

评测结果

Grok 4 当前已收录的代表性评测结果包括 IMO 2024（1 / 10，得分 23.20）、IMO 2025（1 / 9，得分 29.20）、MMLU Pro（14 / 126，得分 87）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 8 项评测

评测名称 / 模式

得分

排名/总数

87

14 / 126

87

39 / 179

66.70

29 / 65

常规模式

62.02

59 / 115

38.60

55 / 159

38.60

55 / 159

25.40

88 / 159

15.90

34 / 59

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

82

25 / 120

SWE-bench Verified

58.60

79 / 108

数学推理

共 9 项评测

评测名称 / 模式

得分

排名/总数

98.80

13 / 106

91.70

36 / 106

46.70

4 / 16

23.30

10 / 16

29.20

1 / 9

23.20

1 / 10

IMO-ProofBench Advanced

18.60

3 / 8

12.10

22 / 60

FrontierMath - Tier 4

常规模式

2.10

56 / 80

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

38

13 / 35

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

思考模式

60.50

15 / 63

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

高

79.60

7 / 59

τ²-Bench - Telecom

75

26 / 35

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Grok 4

发布机构

xAI

查看发布机构详情

Grok 4

模型解读

-------------2025年8月9日Grok4最新消息------------

1. Grok 4 向免费用户开放（不含联网搜索）

自 2025 年 7 月初起，xAI 发布了升级版 Grok 4，带来了更强的性能、原生工具调用以及实时搜索等功能。此前该版本仅面向付费订阅（如 SuperGrok 或 Premium+）开放，而现在免费用户也可以使用 Grok 4，但不支持联网搜索功能。虽然官方公告细节不多，但已有大量用户反馈这一功能已实际开放。

2. PDF 处理能力大幅增强

Grok 4 现在可以轻松处理上百页的大型 PDF 文件，并且在内容识别和理解方面有了显著提升。这项功能在网页端和移动端均可使用，对于研究人员、学生以及需要阅读长文档的专业人士来说是重大利好。

3. Grok Imagine 上线图片与视频生成

在创作能力方面，xAI 将 Grok Imagine 集成到 iOS 与 Android 的 Grok 应用中，带来了一系列视觉生成能力：

支持从文本或图像生成图片和视频
视频最长可达 15 秒，并支持音频同步
提供普通（Normal）、趣味（Fun）、自定义（Custom）、Spicy（成人）四种模式
目前在移动端免费向所有用户开放，且使用量激增——单日生成图片 4400 万张，是前一天的两倍

该功能详情参考： xAI发布Grok Imagine功能，一条文本命令即可生成图片和最长达15秒的视频，也可以基于现有照片生成视频，免费用户也可以使用~

---------原始介绍

马斯克旗下大模型企业xAI发布的第四代大模型。各项评测结果都超过了当前现有的大模型，API接口价格和上一代一样，但是网页版不再免费，需要SuperGrok的会员，300美元一年，或者30美元一个月。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码