DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航
搜索博客
中
EN
加载中...
Kimi K2.5 评测详情 | DataLearnerAI
大模型列表
Kimi K2.5
评测分析
Kimi K2.5 评测详情
以下是 Kimi K2.5 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
Kimi K2.5
评测结果
思考模式
全部
常规
综合评估
共 4 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
default
87.60
21 / 158
MMLU Pro
default
78.50
54 / 114
HLE
default
50.20
44 / 111
HLE
default
30.10
44 / 111
编程与软件工程
共 3 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
default
85
8 / 105
SWE-bench Verified
default
76.80
13 / 90
SWE-Bench Pro - Public
default
50.70
7 / 16
数学推理
共 3 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
default
96.10
20 / 106
AIME 2026
default
92.50
5 / 7
IMO-AnswerBench
default
81.80
5 / 7
常识推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
default
46.80
13 / 27
AI Agent - 信息收集
共 2 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
default
74.90
18 / 33
BrowseComp
default
60.60
18 / 33
AI Agent - 工具使用
共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
default
50.80
14 / 22
生产力知识
共 1 项评测
评测名称 / 模式
得分
排名/总数
GDPval-AA
default
40
8 / 14
长上下文能力
共 1 项评测
评测名称 / 模式
得分
排名/总数
AA-LCR
default
65
8 / 11
与其他模型对比