加载中...
加载中...
Grok-1.5
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Grok-1.5 当前已收录的代表性评测结果包括 HumanEval(25 / 38,得分 74.10)、MMLU(46 / 63,得分 81.30)、MATH(32 / 41,得分 50.60)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
马斯克旗下xAI公司发布的Grok 1.5版本,相比较第一个版本,性能大幅提升。各项评测水平接近GPT-4。

最高支持128K超长上下文。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
