Kimi K2.5vsKimi K2 0905

在 4 个共同 benchmark 中,Kimi K2.5 整体领先:Kimi K2.5 领先 4 项,Kimi K2 0905 领先 0 项,持平 0 项,平均分差 +20.01。

Moonshot AI
Kimi K2.5

Moonshot AI · 2026-01-27 · 多模态大模型

Moonshot AI
Kimi K2 0905

Moonshot AI · 2025-09-05 · 聊天大模型

Kimi K2.54 (100%)(0%)0 Kimi K2 0905

评测分数

按能力类目分组,每组内按分差大小排列;共 4 项。

Coding and Software Engineer

Kimi K2.5 领先 2/2
评测项Kimi K2.5Kimi K2 0905分差
SWE-Bench Pro - Public50.7031 / 43Thinking (With Tools)27.6743 / 43+23.03
SWE-bench Verified76.8027 / 108Thinking (With Tools)69.2059 / 108+7.60

General Knowledge

Kimi K2.5 领先 1/1
评测项Kimi K2.5Kimi K2 0905分差
HLE50.2020 / 157Thinking (With Tools)21.7095 / 157+28.50

Math and Reasoning

Kimi K2.5 领先 1/1
评测项Kimi K2.5Kimi K2 0905分差
AIME202596.1021 / 106Thinking (No Tools)75.2067 / 106+20.90

规格对比

字段Kimi K2.5Kimi K2 0905
发布机构Moonshot AIMoonshot AI
发布时间2026-01-272025-09-05
模型类型多模态大模型聊天大模型
架构MoE 架构MoE 架构
参数规模1万亿1万亿
上下文长度256K256K
最大输出16K4K

小结

  • Kimi K2.5在以下类目领先:Coding and Software Engineer (2/2)、General Knowledge (1/1)、Math and Reasoning (1/1)

4 个共同 benchmark 上,Kimi K2.5 平均高出 20.01 分。

单项差距最大的 benchmark:HLE — Kimi K2.5 50.20,Kimi K2 0905 21.70(分差 +28.50)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。