DeepSeek-V4-ProvsKimi K2.6

在 10 个共同 benchmark 中，Kimi K2.6 整体领先：DeepSeek-V4-Pro 领先 2 项，Kimi K2.6 领先 8 项，持平 0 项，平均分差 -17.34。

DeepSeek-AI · 2026-04-24 · 推理大模型

Moonshot AI · 2026-04-20 · 推理大模型

DeepSeek-V4-Pro2 项(20%)(80%)8 项Kimi K2.6

评测分数

按能力类目分组，每组内按分差大小排列；共 10 项。

Kimi K2.6 领先 4/4

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
LiveCodeBench	56.8076 / 123Normal (No Tools)	89.607 / 123Thinking (No Tools)	-32.80
SWE-bench Multilingual	69.8018 / 23Normal (With Tools)	76.705 / 23Thinking (With Tools)	-6.90
SWE-bench Verified	73.6045 / 112Normal (With Tools)	80.2014 / 112Thinking (With Tools)	-6.60
SWE-Bench Pro - Public	52.1038 / 54Normal (With Tools)	58.6013 / 54Thinking (With Tools)	-6.50

Kimi K2.6 领先 2/3

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
HLE	7.70156 / 172Normal (No Tools)	5415 / 172Thinking (With Tools + Internet)	-46.30
GPQA Diamond	72.90108 / 187Normal (No Tools)	90.5018 / 187Thinking (No Tools)	-17.60
LiveBench	73.5823 / 115Normal (No Tools)	72.1728 / 115Thinking (No Tools)	+1.41

DeepSeek-V4-Pro 领先 1/1

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
BrowseComp	83.4013 / 53极高强度思考（工具）	83.2014 / 53Thinking (With Tools + Internet)	+0.20

Kimi K2.6 领先 1/1

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
Terminal Bench 2.0	59.1022 / 47Normal (With Tools)	66.7010 / 47Thinking (With Tools)	-7.60

Kimi K2.6 领先 1/1

评测项	DeepSeek-V4-Pro	Kimi K2.6	分差
IMO-AnswerBench	35.3021 / 21Normal (No Tools)	868 / 21Thinking (No Tools)	-50.70

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

DeepSeek-V4-Pro在以下类目领先:AI Agent - Information Search (1/1)
Kimi K2.6在以下类目领先:Coding and Software Engineer (4/4)、General Knowledge (2/3)、AI Agent - Tool Usage (1/1)、Math and Reasoning (1/1)

10 个共同 benchmark 上，Kimi K2.6 平均高出 17.34 分。

单项差距最大的 benchmark：IMO-AnswerBench — DeepSeek-V4-Pro 35.30，Kimi K2.6 86（分差 -50.70）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。