Grok 4.1 Fast
支持
2M tokens
推理大模型
2025-11-19
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0.20 美元 / 100万 tokens | 0.50 美元 / 100万 tokens |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 0.05 美元 / 100万 tokens |
Grok 4.1 Fast 是 xAI 发布的面向高性能工具调用与 Agent 工作流的前沿模型,提供最长 2,000,000 tokens 的上下文窗口,并与全新的 Agent Tools API 配合用于实时 X 数据检索、网页搜索与远程代码执行等场景。该版本同时提供 reasoning 与 non-reasoning 两种形态,用于在智能强度与响应时延之间进行权衡。
官方未披露参数规模与架构细节(如是否为 MoE)。该模型通过在模拟环境中的强化学习进行长期、多回合的工具使用训练,强调长程规划与多轮调用一致性,以确保在 2M tokens 的长上下文下仍保持稳定表现。
grok-4-1-fast-reasoning 与 grok-4-1-fast-non-reasoning 两个变体;并在部分平台(如 OpenRouter)提供试用入口。关注DataLearnerAI微信公众号,接受最新大模型资讯