DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
Llama3.3-70B-Instruct 评测详情 | DataLearnerAI
大模型列表
Llama3.3-70B-Instruct
评测分析
Llama3.3-70B-Instruct 评测详情
以下是 Llama3.3-70B-Instruct 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
Llama3.3-70B-Instruct
评测结果
思考模式
全部
常规
综合评估
共 3 项评测
评测名称 / 模式
得分
排名/总数
MMLU
normal
86
31 / 62
MMLU Pro
normal
68.90
82 / 114
GPQA Diamond
normal
50.50
133 / 160
编程与软件工程
共 3 项评测
评测名称 / 模式
得分
排名/总数
HumanEval
normal
88.40
14 / 37
MBPP
normal
87.60
3 / 27
LiveCodeBench
normal
33.30
96 / 106
数学推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
MATH
normal
77
13 / 41
与其他模型对比