DeepSeek-V3.1 评测详情
DeepSeek-V3.1 当前已收录的代表性评测结果包括 MMLU(1 / 65,得分 93.40)、SimpleQA(4 / 45,得分 93.40)、AIME 2024(7 / 62,得分 93.10)。
评测结果
DeepSeek-V3.1
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
DeepSeek-V3.1 当前已收录的代表性评测结果包括 MMLU(1 / 65,得分 93.40)、SimpleQA(4 / 45,得分 93.40)、AIME 2024(7 / 62,得分 93.10)。