GR

Grok 4 Fast

Grok 4 Fast

发布时间: 2025-09-19304
模型参数
未披露
上下文长度
2000K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
2000K tokens
最大输出长度
4096 tokens
模型类型
暂无数据
发布时间
2025-09-19
模型文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

官方介绍与博客

API接口信息

接口速度
4/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.2$0.5
图片$0.2--

评测得分

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamondthinking
85.70
15 / 138
LiveBenchnormal
68.09
26 / 52
HLEthinking
20
34 / 78

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQAthinking + 使用工具
95
3 / 44

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
80
13 / 98

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025thinking
92
29 / 98

发布机构

模型解读

关于Grok 4 Fast更深度分析可以参考我们的博客: https://www.datalearner.com/blog/1051758459872078 


xAI 于 2025 年 9 月 19 日发布了 Grok-4 Fast 模型。该模型是一种高效的推理模型,旨在提供高性能的同时降低成本。

模型特性

Grok-4 Fast 支持 2M 令牌的上下文窗口,能够处理较长的对话或复杂数据集。其架构统一,支持通过系统提示在推理模式和非推理模式之间切换。模型通过端到端的工具使用强化学习训练,能够根据需要调用工具,如代码执行或网页浏览。此外,它具备代理搜索功能,可浏览网页和 X(前 Twitter),并处理图像和视频等媒体,以获取实时数据。

基准测试结果

Grok-4 Fast 在多项基准测试中表现出色,与前代模型 Grok 3 Mini 相比,使用了平均 40% 更少的思考令牌。以下是部分测试结果(均为 pass@1,无工具,除非注明):

基准测试Grok-4 Fast 分数备注

GPQA Diamond85.7%高难度推理

AIME 202592.0%数学竞赛级问题

HMMT 202593.3%高级数学挑战

HLE (Human Level Eval)20.0%人类水平评估

LiveCodeBench (Jan-May)80.0%实际编码任务

在搜索相关评估中,其分数为:BrowseComp 44.9%、SimpleQA 95.0%、Reka Research Eval 66.0%。在 LMSYS Arena 中,启用搜索的变体(grok-4-fast-search,代号“menlo”)Elo 分数为 1163,排名第一;基础模型(“tahoe”)在 Text Arena 中排名第八。

性能与成本比较

根据 Artificial Analysis 的独立评估,Grok-4 Fast 在价格与智能指数的比率上处于领先地位,其性能接近 Grok-4,但成本降低了 98%。在智能指数与价格图表中,该模型优于 Gemini 2.5 Flash 和 DeepSeek V3.1 等模型,适用于实时应用,具有较低的延迟和令牌成本。

可用性和定价

Grok-4 Fast 现已可用,用户可通过 grok.com、iOS 和 Android 应用访问,选择“Fast”或“Auto”模式。对于 API 用户,xAI 提供 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 变体,定价如下:

  • 输入令牌:小于 128k 时 $0.20 / 1M,大于等于 128k 时 $0.40 / 1M
  • 输出令牌:小于 128k 时 $0.50 / 1M,大于等于 128k 时 $1.00 / 1M
  • 缓存输入:$0.05 / 1M

未来发展

xAI 计划根据 X 上的反馈持续改进模型,包括增强多模态功能和代理工具支持。截至 2025 年 9 月 21 日,该模型已准备用于企业和消费者应用。