Qwen 3.6 Plus PreviewvsKimi K2.5

在 13 个共同 benchmark 中，Qwen 3.6 Plus Preview 整体领先：Qwen 3.6 Plus Preview 领先 13 项，Kimi K2.5 领先 0 项，持平 0 项，平均分差 +3.51。

阿里巴巴 · 2026-03-31 · 聊天大模型

Moonshot AI · 2026-01-27 · 多模态大模型

Qwen 3.6 Plus Preview13 项(100%)(0%)0 项Kimi K2.5

评测分数

按能力类目分组，每组内按分差大小排列；共 13 项。

Qwen 3.6 Plus Preview 领先 4/4

评测项	Qwen 3.6 Plus Preview	Kimi K2.5	分差
SWE-Bench Pro - Public	56.6020 / 54Thinking (With Tools)	50.7041 / 54Thinking (With Tools)	+5.90
LiveCodeBench	87.1010 / 123Thinking (No Tools)	8516 / 123Thinking (No Tools)	+2.10
SWE-bench Verified	78.8021 / 112Thinking (With Tools)	76.8030 / 112Thinking (With Tools)	+2
SWE-bench Multilingual	73.809 / 23Thinking (No Tools)	7313 / 23Thinking (No Tools)	+0.80

Qwen 3.6 Plus Preview 领先 4/4

评测项	Qwen 3.6 Plus Preview	Kimi K2.5	分差
MMLU Pro	88.505 / 132Thinking (No Tools)	78.5069 / 132Thinking (No Tools)	+10
GPQA Diamond	90.4019 / 187Thinking (No Tools)	87.6037 / 187Thinking (No Tools)	+2.80
LiveBench	70.8534 / 115Normal (No Tools)	69.0742 / 115Thinking (No Tools)	+1.78
HLE	50.6024 / 172Thinking (With Tools)	50.2027 / 172Thinking (With Tools)	+0.40

Qwen 3.6 Plus Preview 领先 2/2

评测项	Qwen 3.6 Plus Preview	Kimi K2.5	分差
AA-LCR	68.308 / 15Thinking (No Tools)	6512 / 15Thinking (No Tools)	+3.30
LongBench v2	623 / 11Normal (No Tools)	615 / 11Normal (No Tools)	+1

Qwen 3.6 Plus Preview 领先 2/2

评测项	Qwen 3.6 Plus Preview	Kimi K2.5	分差
AIME 2026	95.304 / 18Thinking (No Tools)	92.5012 / 18Thinking (No Tools)	+2.80
IMO-AnswerBench	83.8012 / 21Thinking (No Tools)	81.8016 / 21Thinking (No Tools)	+2

Qwen 3.6 Plus Preview 领先 1/1

评测项	Qwen 3.6 Plus Preview	Kimi K2.5	分差
Terminal Bench 2.0	61.6016 / 47Thinking (With Tools)	50.8034 / 47Thinking (With Tools)	+10.80

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

Qwen 3.6 Plus Preview在以下类目领先:Coding and Software Engineer (4/4)、General Knowledge (4/4)、Long Context (2/2)、Math and Reasoning (2/2)、AI Agent - Tool Usage (1/1)

13 个共同 benchmark 上，Qwen 3.6 Plus Preview 平均高出 3.51 分。

单项差距最大的 benchmark：Terminal Bench 2.0 — Qwen 3.6 Plus Preview 61.60，Kimi K2.5 50.80（分差 +10.80）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。