加载中...
加载中...
Grok-3 - Reasoning Beta
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Grok-3 - Reasoning Beta 当前已收录的代表性评测结果包括 AIME 2024(6 / 62,得分 93.30)、LiveCodeBench(24 / 108,得分 79.40)、GPQA Diamond(37 / 162,得分 84.60)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Grok3模型的推理版本,这是当前还未训练完成,是beta版本。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
