GR

Grok 2

聊天大模型

Grok 2

发布时间: 2024-08-13更新于: 2025-08-24 17:37:031,073
模型参数
2690亿
上下文长度
128K
中文支持
支持
推理能力

Grok 2 是由 xAI 发布的 AI 模型,发布时间为 2024-08-13,定位为 聊天大模型,参数规模约为 2690亿,上下文长度为 128K,采用 Grok 2 Community License Agreement 许可,在 HumanEval 上取得 88.40 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Grok 2

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
128K tokens
最大输出长度
32K tokens
模型类型
聊天大模型
输入/输出模态
文本 → 文本
发布时间
2024-08-13
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
2690亿 / 1150亿
知识截止
暂无数据
Grok 2

开源和体验地址

预训练权重开源
GitHub 源码
暂无GitHub开源地址
在线体验
Grok 2

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Grok 2

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
Grok 2

评测结果

Grok 2 当前已收录的代表性评测结果包括 MMLU(22 / 65,得分 87.50)、MATH(15 / 42,得分 76.10)、HumanEval(14 / 39,得分 88.40)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
87.50
22 / 65
75.50
81 / 126
56
147 / 179

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
88.40
14 / 39

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
76.10
15 / 42
0.70
55 / 60

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
22.70
56 / 63

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Grok 2

发布机构

Grok 2

模型解读

-------------2025年8月24日更新:xAI把这个模型开源了,马斯克对外宣称该模型是Grok 2.5,其实应该是2.0之后训练的版本,对外公开的此前一直是Grok 2.0模型,开源后可以免费商用,不过不允许用该模型生成的数据进行训练。


Grok2开源后大家发现该模型和Grok 1一致,词汇表大小128K,MoE架构,总参数2690亿,激活参数1150亿(基于模型配置估计结果),8个专家,每次推理激活其中2个专家。



Grok2在多方面进行了技术升级:

上下文长度:Grok2的上下文处理能力得到了显著增强,可以处理高达128,000个token的文本。这意味着它能够在更大的文本范围内保持对话的连贯性和一致性,适用于处理长文档或复杂查询的场景。

模型架构:尽管具体的架构细节尚未公开,但根据xAI的声明,Grok2采用了更先进的架构设计,可能包括更深的网络层或更有效的注意力机制,旨在提高模型的理解和生成能力。

训练数据:Grok2的训练数据集得到了扩展和优化,涵盖了更广泛的文本种类和语言,这有助于提高模型的泛化能力,使其在多种语言和文化背景下都能表现出色。

性能与应用

语言理解与生成:Grok2在自然语言理解和生成方面的表现得到了显著提升。它能更自然地处理复杂的对话,理解其中的细微差别,并以更人性化的方式回应用户。

多模态能力:虽然主要是文本处理模型,Grok2也在朝着多模态处理的方向发展,计划整合图像和视频理解的能力,这将在未来拓展其应用场景。

科学研究辅助:正如xAI的使命所述,Grok2被设计为科学研究的辅助工具。它能够帮助研究人员理解复杂的科学文献、生成假设、甚至提出实验设计建议。

用户体验:Grok2的用户界面和交互性也有所改进,旨在提供更直观、更友好的用户体验,特别是在提供帮助和解决问题时。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码