Qwen 3.6 Plus PreviewvsKimi K2.5
在 11 个共同 benchmark 中,Qwen 3.6 Plus Preview 整体领先:Qwen 3.6 Plus Preview 领先 11 项,Kimi K2.5 领先 0 项,持平 0 项,平均分差 +3.90。
Qwen 3.6 Plus Preview
阿里巴巴 · 2026-03-31 · 聊天大模型
Kimi K2.5
Moonshot AI · 2026-01-27 · 多模态大模型
在 11 个共同 benchmark 中,Qwen 3.6 Plus Preview 整体领先:Qwen 3.6 Plus Preview 领先 11 项,Kimi K2.5 领先 0 项,持平 0 项,平均分差 +3.90。
阿里巴巴 · 2026-03-31 · 聊天大模型
Moonshot AI · 2026-01-27 · 多模态大模型
按能力类目分组,每组内按分差大小排列;共 11 项。
| 评测项 | Qwen 3.6 Plus Preview | Kimi K2.5 | 分差 |
|---|---|---|---|
| SWE-Bench Pro - Public | 56.609 / 36Thinking (With Tools) | 50.7025 / 36Thinking (With Tools) | +5.90 |
| LiveCodeBench | 87.109 / 118Thinking (No Tools) | 8514 / 118Thinking (No Tools) | +2.10 |
| SWE-bench Verified | 78.8016 / 103Thinking (With Tools) | 76.8022 / 103Thinking (With Tools) | +2 |
| SWE-bench Multilingual | 73.805 / 17Thinking (No Tools) | 738 / 17Thinking (No Tools) | +0.80 |
| 评测项 | Qwen 3.6 Plus Preview | Kimi K2.5 | 分差 |
|---|---|---|---|
| MMLU Pro | 88.504 / 124Thinking (No Tools) | 78.5064 / 124Thinking (No Tools) | +10 |
| GPQA Diamond | 90.4015 / 175Thinking (No Tools) | 87.6031 / 175Thinking (No Tools) | +2.80 |
| HLE | 50.6014 / 149Thinking (With Tools) | 50.2017 / 149Thinking (With Tools) | +0.40 |
| 评测项 | Qwen 3.6 Plus Preview | Kimi K2.5 | 分差 |
|---|---|---|---|
| AIME 2026 | 95.302 / 14Thinking (No Tools) | 92.5010 / 14Thinking (No Tools) | +2.80 |
| IMO-AnswerBench | 83.809 / 17Thinking (No Tools) | 81.8012 / 17Thinking (No Tools) | +2 |
| 评测项 | Qwen 3.6 Plus Preview | Kimi K2.5 | 分差 |
|---|---|---|---|
| Terminal Bench 2.0 | 61.6014 / 43Thinking (With Tools) | 50.8030 / 43Thinking (With Tools) | +10.80 |
| 评测项 | Qwen 3.6 Plus Preview | Kimi K2.5 | 分差 |
|---|---|---|---|
| AA-LCR | 68.306 / 13Thinking (No Tools) | 6510 / 13Thinking (No Tools) | +3.30 |
| 字段 | Qwen 3.6 Plus Preview | Kimi K2.5 |
|---|---|---|
| 发布机构 | 阿里巴巴 | Moonshot AI |
| 发布时间 | 2026-03-31 | 2026-01-27 |
| 模型类型 | 聊天大模型 | 多模态大模型 |
| 架构 | 稠密模型 | MoE 架构 |
| 参数规模 | 0.0 | 10000.0 |
| 上下文长度 | 1M | 256K |
| 最大输出 | 65536 | 16384 |
价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。
| 价格项 | Qwen 3.6 Plus Preview | Kimi K2.5 |
|---|---|---|
| 文本输入 | $0.5 / 1M tokens | 0.6 美元/100 万tokens |
| 文本输出 | $3 / 1M tokens | 3 美元/100 万tokens |
| 缓存读取 | $0.05 / 1M tokens | 0.1 美元/100 万tokens |
| 缓存写入 | $0.625 / 1M tokens | 暂无公开价格 |
11 个共同 benchmark 上,Qwen 3.6 Plus Preview 平均高出 3.90 分。
单项差距最大的 benchmark:Terminal Bench 2.0 — Qwen 3.6 Plus Preview 61.60,Kimi K2.5 50.80(分差 +10.80)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。