DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
Kimi K2 0905 评测详情 | DataLearnerAI
大模型列表
Kimi K2 0905
评测分析
Kimi K2 0905 评测详情
以下是 Kimi K2 0905 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
Kimi K2 0905
评测结果
思考模式
全部
常规
思考
思考模式细分 (1)
全部
默认 (thinking)
工具使用
全部
使用工具
不使用工具
综合评估
共 1 项评测
评测名称 / 模式
得分
排名/总数
HLE
thinking
使用工具
21.70
58 / 114
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
thinking
使用工具
69.20
44 / 90
数学推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
thinking
使用工具
75.20
68 / 107
AI Agent - 工具使用
共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
thinking
使用工具
44.50
6 / 35
与其他模型对比