Kimi K2.5vsKimi K2 0905

在 4 个共同 benchmark 中，Kimi K2.5 整体领先：Kimi K2.5 领先 4 项，Kimi K2 0905 领先 0 项，持平 0 项，平均分差 +20.01。

Moonshot AI · 2026-01-27 · 多模态大模型

Moonshot AI · 2025-09-05 · 聊天大模型

Kimi K2.54 项(100%)(0%)0 项Kimi K2 0905

评测分数

按能力类目分组，每组内按分差大小排列；共 4 项。

Kimi K2.5 领先 2/2

评测项	Kimi K2.5	Kimi K2 0905	分差
SWE-Bench Pro - Public	50.7031 / 43Thinking (With Tools)	27.6743 / 43	+23.03
SWE-bench Verified	76.8027 / 108Thinking (With Tools)	69.2059 / 108	+7.60

Kimi K2.5 领先 1/1

评测项	Kimi K2.5	Kimi K2 0905	分差
HLE	50.2020 / 157Thinking (With Tools)	21.7095 / 157	+28.50

Kimi K2.5 领先 1/1

评测项	Kimi K2.5	Kimi K2 0905	分差
AIME2025	96.1021 / 106Thinking (No Tools)	75.2067 / 106	+20.90

Kimi K2.5在以下类目领先:Coding and Software Engineer (2/2)、General Knowledge (1/1)、Math and Reasoning (1/1)

4 个共同 benchmark 上，Kimi K2.5 平均高出 20.01 分。

单项差距最大的 benchmark：HLE — Kimi K2.5 50.20，Kimi K2 0905 21.70（分差 +28.50）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。