大模型评测

大模型列表

大模型对比

语言中文

搜索博客

加载中...

DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台，持续更新可落地的 AI 能力图谱。

产品

评测榜单
模型对比
数据资源

资源

部署教程
原创内容
工具导航

关于

关于我们
隐私政策
数据收集方法
联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例，为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款

Grok-3 - Reasoning Beta 评测结果与参数详情 | DataLearnerAI

页面导航

目录

大模型列表Grok-3 - Reasoning Beta

GR

Grok-3 - Reasoning Beta

Grok-3 - Reasoning Beta

发布时间: 2025-02-18更新于: 2025-02-18 13:20:30712

在线体验

GitHub

Hugging Face

模型参数

未披露

上下文长度

128K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Grok-3 - Reasoning Beta

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

推理大模型

发布时间

2025-02-18

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Grok-3 - Reasoning Beta

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源- 不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

Grok-3 - Reasoning Beta

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

Grok-3 - Reasoning Beta

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Grok-3 - Reasoning Beta

评测结果

Grok-3 - Reasoning Beta 当前已收录的代表性评测结果包括 AIME 2024（6 / 62，得分 93.30）、LiveCodeBench（24 / 108，得分 79.40）、GPQA Diamond（37 / 162，得分 84.60）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 1 项评测

评测名称 / 模式

得分

排名/总数

关闭

84.60

37 / 162

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

关闭

93.30

6 / 62

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总数

关闭

79.40

24 / 108

查看评测深度分析与其他模型对比

Grok-3 - Reasoning Beta

发布机构

xAI

查看发布机构详情

Grok-3 - Reasoning Beta

模型解读

Grok3模型的推理版本，这是当前还未训练完成，是beta版本。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码