加载中...
Grok-1.5 当前已收录的代表性评测结果包括 HumanEval(25 / 38,得分 74.10)、MMLU(46 / 63,得分 81.30)、MATH(32 / 41,得分 50.60)。