DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航
搜索博客
中
EN
加载中...
Qwen2.5-Max 评测详情 | DataLearnerAI
大模型列表
Qwen2.5-Max
评测分析
Qwen2.5-Max 评测详情
以下是 Qwen2.5-Max 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
Qwen2.5-Max
评测结果
思考模式
全部
常规
综合评估
共 2 项评测
评测名称 / 模式
得分
排名/总数
MMLU
default
87.90
19 / 61
MMLU Pro
default
76.10
64 / 114
数学推理
共 3 项评测
评测名称 / 模式
得分
排名/总数
GSM8K
default
94.50
8 / 24
MATH
default
68.50
24 / 41
FrontierMath
default
1
47 / 55
编程与软件工程
共 2 项评测
评测名称 / 模式
得分
排名/总数
MBPP
default
80.60
10 / 27
HumanEval
default
73.20
25 / 36
与其他模型对比