GR

Grok 3

聊天大模型Grok-3

Grok 3

发布时间: 2025-02-17更新于: 2025-02-18 17:12:381,350
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
128K
中文支持
支持
推理能力

Grok 3 是由 xAI 发布的 AI 模型,发布时间为 2025-02-17,定位为 聊天大模型,上下文长度为 128K,采用 不开源 许可,在 AIME 2024 上取得 84.20 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Grok 3

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
输入/输出模态
暂无数据
发布时间
2025-02-17
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
暂无数据 / 不涉及
知识截止
暂无数据
Grok 3

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
Grok 3

官方介绍与博客

Grok 3

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Grok 3

评测结果

Grok 3 当前已收录的代表性评测结果包括 AIME 2024(22 / 62,得分 84.20)、SimpleQA(16 / 45,得分 43.40)、GPQA Diamond(75 / 179,得分 80.40)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
80.40
75 / 179

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
43.40
16 / 45

数学推理

共 4 项评测
评测名称 / 模式
得分
排名/总数
84.20
22 / 62
77.10
62 / 106
3.80
45 / 60
0
72 / 80

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
70.60
52 / 120

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
36.10
44 / 63

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
Aider-Polyglot
常规模式
53.30
30 / 59

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Grok 3

发布机构

Grok 3

模型解读

Grok-3是xAI发布的第三代大语言模型,在2025年2月17日发布。


Grok-3系列模型分为2个版本,分别是Grok-3和Grok-3 mini,官方没有公布参数等信息。这两个版本的模型都支持推理模式,其中Grok-3 mini的Reasoning版本已经训练完成,而Grok-3 Reasoning目前是beta版本,并未正式发布。


关于Grok-3大模型的具体介绍,参考DataLearnerAI的博客: https://www.datalearner.com/blog/1051739847418034 


为了更加清晰对比Grok-3模型和其它模型的对比结果,我们DataLearnerAI汇总了所有的大模型对比,数据来源: https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=37,32&modelInputString=511,510,509,508,501,495,492,488,470,429 

https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=37,32&modelInputString=511,510,509,508,501,495,492,488,470,429

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码