Grok 4 Fast
Grok 4 Fast
模型基本信息
开源和体验地址
官方介绍与博客
API接口信息
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.2 | $0.5 |
| 图片 | $0.2 | -- |
评测得分
综合评估
共 3 项评测发布机构
模型解读
关于Grok 4 Fast更深度分析可以参考我们的博客: https://www.datalearner.com/blog/1051758459872078
xAI 于 2025 年 9 月 19 日发布了 Grok-4 Fast 模型。该模型是一种高效的推理模型,旨在提供高性能的同时降低成本。
模型特性
Grok-4 Fast 支持 2M 令牌的上下文窗口,能够处理较长的对话或复杂数据集。其架构统一,支持通过系统提示在推理模式和非推理模式之间切换。模型通过端到端的工具使用强化学习训练,能够根据需要调用工具,如代码执行或网页浏览。此外,它具备代理搜索功能,可浏览网页和 X(前 Twitter),并处理图像和视频等媒体,以获取实时数据。
基准测试结果
Grok-4 Fast 在多项基准测试中表现出色,与前代模型 Grok 3 Mini 相比,使用了平均 40% 更少的思考令牌。以下是部分测试结果(均为 pass@1,无工具,除非注明):
基准测试Grok-4 Fast 分数备注
GPQA Diamond85.7%高难度推理
AIME 202592.0%数学竞赛级问题
HMMT 202593.3%高级数学挑战
HLE (Human Level Eval)20.0%人类水平评估
LiveCodeBench (Jan-May)80.0%实际编码任务
在搜索相关评估中,其分数为:BrowseComp 44.9%、SimpleQA 95.0%、Reka Research Eval 66.0%。在 LMSYS Arena 中,启用搜索的变体(grok-4-fast-search,代号“menlo”)Elo 分数为 1163,排名第一;基础模型(“tahoe”)在 Text Arena 中排名第八。
性能与成本比较
根据 Artificial Analysis 的独立评估,Grok-4 Fast 在价格与智能指数的比率上处于领先地位,其性能接近 Grok-4,但成本降低了 98%。在智能指数与价格图表中,该模型优于 Gemini 2.5 Flash 和 DeepSeek V3.1 等模型,适用于实时应用,具有较低的延迟和令牌成本。
可用性和定价
Grok-4 Fast 现已可用,用户可通过 grok.com、iOS 和 Android 应用访问,选择“Fast”或“Auto”模式。对于 API 用户,xAI 提供 grok-4-fast-reasoning 和 grok-4-fast-non-reasoning 变体,定价如下:
- 输入令牌:小于 128k 时 $0.20 / 1M,大于等于 128k 时 $0.40 / 1M
- 输出令牌:小于 128k 时 $0.50 / 1M,大于等于 128k 时 $1.00 / 1M
- 缓存输入:$0.05 / 1M
未来发展
xAI 计划根据 X 上的反馈持续改进模型,包括增强多模态功能和代理工具支持。截至 2025 年 9 月 21 日,该模型已准备用于企业和消费者应用。