Grok 4.20 Beta 评测详情

Grok 4.20 Beta 当前已收录的代表性评测结果包括 LiveBench(47 / 115,得分 67.96)。

评测结果

Grok 4.20 Beta

评测结果

思考模式

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveBench
常规模式
39.70
110 / 115
LiveBench
开启思考
67.96
47 / 115