DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航
搜索博客
中
EN
加载中...
大模型列表
GLM-4-9B-Chat
评测分析
GLM-4-9B-Chat 评测详情
以下是 GLM-4-9B-Chat 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
GLM-4-9B-Chat
评测结果
思考模式
全部
常规
综合评估
共 2 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
常规
72.40
75 / 114
GPQA
常规
58.50
5 / 13
数学推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME 2024
常规
76.40
35 / 62
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
常规
51.80
73 / 104
与其他模型对比