DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
GLM-4.6 评测详情 | DataLearnerAI
大模型列表
GLM-4.6
评测分析
GLM-4.6 评测详情
以下是 GLM-4.6 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
GLM-4.6
评测结果
思考模式
全部
常规
思考
思考模式细分 (2)
全部
默认 (thinking)
thinking
工具使用
全部
使用工具
不使用工具
综合评估
共 4 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
thinking
83
34 / 114
GPQA Diamond
thinking
81
52 / 160
LiveBench
thinking
71.22
17 / 51
HLE
thinking
17.20
77 / 114
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
thinking
82.80
16 / 106
数学推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
thinking
98.60
15 / 107
指令跟随
共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
thinking
43
26 / 26
与其他模型对比