GR

Grok 4

推理大模型Grok 4

Grok 4

发布时间: 2025-07-10更新于: 2025-08-09 22:51:233,142
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
256K
中文支持
支持
推理能力

Grok 4 是由 xAI 发布的 AI 模型,发布时间为 2025-07-10,定位为 推理大模型,上下文长度为 256K,采用 不开源 许可,在 AIME2025 上取得 98.80 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Grok 4

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
256K tokens
最大输出长度
256K tokens
模型类型
推理大模型
输入/输出模态
文本、图像 → 文本
发布时间
2025-07-10
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
Grok 4

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
Grok 4

官方介绍与博客

Grok 4

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
Grok 4

评测结果

Grok 4 当前已收录的代表性评测结果包括 IMO 2024(1 / 10,得分 23.20)、IMO 2025(1 / 9,得分 29.20)、MMLU Pro(14 / 126,得分 87)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 8 项评测
评测名称 / 模式
得分
排名/总数
87
14 / 126
87
39 / 179
66.70
29 / 65
LiveBench
常规模式
62.02
59 / 115
38.60
55 / 159
38.60
55 / 159
25.40
88 / 159
15.90
34 / 59

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
82
25 / 120
58.60
79 / 108

数学推理

共 9 项评测
评测名称 / 模式
得分
排名/总数
98.80
13 / 106
91.70
36 / 106
46.70
4 / 16
23.30
10 / 16
29.20
1 / 9
23.20
1 / 10
12.10
22 / 60
2.10
56 / 80

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
思考模式
60.50
15 / 63

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
79.60
7 / 59

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Grok 4

发布机构

Grok 4

模型解读

-------------2025年8月9日Grok4最新消息------------

1. Grok 4 向免费用户开放(不含联网搜索)

自 2025 年 7 月初起,xAI 发布了升级版 Grok 4,带来了更强的性能、原生工具调用以及实时搜索等功能。此前该版本仅面向付费订阅(如 SuperGrok 或 Premium+)开放,而现在免费用户也可以使用 Grok 4,但不支持联网搜索功能。虽然官方公告细节不多,但已有大量用户反馈这一功能已实际开放

2. PDF 处理能力大幅增强

Grok 4 现在可以轻松处理上百页的大型 PDF 文件,并且在内容识别和理解方面有了显著提升。这项功能在网页端和移动端均可使用,对于研究人员、学生以及需要阅读长文档的专业人士来说是重大利好。

3. Grok Imagine 上线图片与视频生成

在创作能力方面,xAI 将 Grok Imagine 集成到 iOS 与 Android 的 Grok 应用中,带来了一系列视觉生成能力:

  • 支持从文本或图像生成图片和视频
  • 视频最长可达 15 秒,并支持音频同步
  • 提供 普通(Normal)、趣味(Fun)、自定义(Custom)、Spicy(成人) 四种模式
  • 目前在移动端免费向所有用户开放,且使用量激增——单日生成图片 4400 万张,是前一天的两倍

该功能详情参考:  xAI发布Grok Imagine功能,一条文本命令即可生成图片和最长达15秒的视频,也可以基于现有照片生成视频,免费用户也可以使用~ 


---------原始介绍

马斯克旗下大模型企业xAI发布的第四代大模型。各项评测结果都超过了当前现有的大模型,API接口价格和上一代一样,但是网页版不再免费,需要SuperGrok的会员,300美元一年,或者30美元一个月。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码