Qwen 3.6 Plus PreviewvsKimi K2.5

Across 13 shared benchmarks, Qwen 3.6 Plus Preview leads overall: Qwen 3.6 Plus Preview wins 13, Kimi K2.5 wins 0, with 0 ties and an average score difference of +3.51.

Qwen 3.6 Plus Preview

阿里巴巴 · 2026-03-31 · Chat model

Kimi K2.5

Moonshot AI · 2026-01-27 · Multimodal model

Qwen 3.6 Plus Preview13 wins(100%)(0%)0 winsKimi K2.5

Benchmark scores

Grouped by capability, sorted by largest gap within each. 13 shared benchmarks.

Coding and Software Engineer

Qwen 3.6 Plus Preview 4/4

Benchmark	Qwen 3.6 Plus Preview	Kimi K2.5	Diff
SWE-Bench Pro - Public	56.6020 / 54Thinking (With Tools)	50.7041 / 54Thinking (With Tools)	+5.90
LiveCodeBench	87.1010 / 123Thinking (No Tools)	8516 / 123Thinking (No Tools)	+2.10
SWE-bench Verified	78.8021 / 112Thinking (With Tools)	76.8030 / 112Thinking (With Tools)	+2
SWE-bench Multilingual	73.809 / 23Thinking (No Tools)	7313 / 23Thinking (No Tools)	+0.80

General Knowledge

Qwen 3.6 Plus Preview 4/4

Benchmark	Qwen 3.6 Plus Preview	Kimi K2.5	Diff
MMLU Pro	88.505 / 132Thinking (No Tools)	78.5069 / 132Thinking (No Tools)	+10
GPQA Diamond	90.4019 / 187Thinking (No Tools)	87.6037 / 187Thinking (No Tools)	+2.80
LiveBench	70.8534 / 115Normal (No Tools)	69.0742 / 115Thinking (No Tools)	+1.78
HLE	50.6024 / 172Thinking (With Tools)	50.2027 / 172Thinking (With Tools)	+0.40

Long Context

Qwen 3.6 Plus Preview 2/2

Benchmark	Qwen 3.6 Plus Preview	Kimi K2.5	Diff
AA-LCR	68.308 / 15Thinking (No Tools)	6512 / 15Thinking (No Tools)	+3.30
LongBench v2	623 / 11Normal (No Tools)	615 / 11Normal (No Tools)	+1

Math and Reasoning

Qwen 3.6 Plus Preview 2/2

Benchmark	Qwen 3.6 Plus Preview	Kimi K2.5	Diff
AIME 2026	95.304 / 18Thinking (No Tools)	92.5012 / 18Thinking (No Tools)	+2.80
IMO-AnswerBench	83.8012 / 21Thinking (No Tools)	81.8016 / 21Thinking (No Tools)	+2

AI Agent - Tool Usage

Qwen 3.6 Plus Preview 1/1

Benchmark	Qwen 3.6 Plus Preview	Kimi K2.5	Diff
Terminal Bench 2.0	61.6016 / 47Thinking (With Tools)	50.8034 / 47Thinking (With Tools)	+10.80

Specs

Field	Qwen 3.6 Plus Preview	Kimi K2.5
Publisher	阿里巴巴	Moonshot AI
Release date	2026-03-31	2026-01-27
Model type	Chat model	Multimodal model
Architecture	Dense	MoE
Parameters	Not available	1T
Context length	1M	256K
Max output	64K	16K

API pricing

Prices use DataLearner records when available; missing fields are not inferred.

Item	Qwen 3.6 Plus Preview	Kimi K2.5
Text input	$0.5 / 1M tokens	$0.6 / 1M tokens
Text output	$3 / 1M tokens	$3 / 1M tokens
Cache read	$0.05 / 1M tokens	$0.1 / 1M tokens
Cache write	$0.625 / 1M tokens	Not public

Summary

Qwen 3.6 Plus Previewleads in:Coding and Software Engineer (4/4), General Knowledge (4/4), Long Context (2/2), Math and Reasoning (2/2), AI Agent - Tool Usage (1/1)

On average across the 13 shared benchmarks, Qwen 3.6 Plus Preview scores 3.51 higher.

Largest single-benchmark gap: Terminal Bench 2.0 — Qwen 3.6 Plus Preview 61.60 vs Kimi K2.5 50.80 (+10.80).

Page generated from structured model, pricing and benchmark records. No real-time LLM is used to write the prose.

Qwen 3.6 Plus Preview details Kimi K2.5 details·Customize in compare tool