DeepSeek-R1-Distill-Qwen-7B 评测详情

DeepSeek-R1-Distill-Qwen-7B 当前已收录的代表性评测结果包括 AIME 2024(45 / 62,得分 53.30)、MATH-500(32 / 44,得分 91.40)、GPQA Diamond(155 / 179,得分 49.50)。

评测结果

DeepSeek-R1-Distill-Qwen-7B

评测结果

思考模式

综合评估

共 1 项评测
评测名称 / 模式
得分
排名/总数
49.50
155 / 179

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
91.40
32 / 44
53.30
45 / 62