Qwen 3.6 Plus PreviewvsQwen3.5-397B-A17B
在 14 个共同 benchmark 中,Qwen 3.6 Plus Preview 整体领先:Qwen 3.6 Plus Preview 领先 12 项,Qwen3.5-397B-A17B 领先 2 项,持平 0 项,平均分差 +2.59。
Qwen 3.6 Plus Preview
阿里巴巴 · 2026-03-31 · 聊天大模型
在 14 个共同 benchmark 中,Qwen 3.6 Plus Preview 整体领先:Qwen 3.6 Plus Preview 领先 12 项,Qwen3.5-397B-A17B 领先 2 项,持平 0 项,平均分差 +2.59。
阿里巴巴 · 2026-03-31 · 聊天大模型
阿里巴巴 · 2026-02-16 · 多模态大模型
按能力类目分组,每组内按分差大小排列;共 14 项。
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| HLE | 50.6014 / 149Thinking (With Tools) | 48.3023 / 149Thinking (With Tools + Internet) | +2.30 |
| GPQA Diamond | 90.4015 / 175Thinking (No Tools) | 88.4023 / 175Thinking (No Tools) | +2 |
| MMLU Pro | 88.504 / 124Thinking (No Tools) | 87.808 / 124Thinking (No Tools) | +0.70 |
| C-Eval | 93.302 / 9Thinking (No Tools) | 933 / 9Thinking (No Tools) | +0.30 |
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| SWE-Bench Pro - Public | 56.609 / 36Thinking (With Tools) | 50.9023 / 36Thinking (No Tools) | +5.70 |
| SWE-bench Multilingual | 73.805 / 17Thinking (No Tools) | 69.3014 / 17Thinking (No Tools) | +4.50 |
| LiveCodeBench | 87.109 / 118Thinking (No Tools) | 83.6018 / 118Thinking (No Tools) | +3.50 |
| SWE-bench Verified |
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| Terminal Bench 2.0 | 61.6014 / 43Thinking (With Tools) | 52.5026 / 43Thinking (With Tools) | +9.10 |
| Tool Decathlon | 39.804 / 7Thinking (With Tools) | 38.305 / 7Thinking (With Tools) | +1.50 |
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| AIME 2026 | 95.302 / 14Thinking (No Tools) | 91.3011 / 14Thinking (No Tools) | +4 |
| IMO-AnswerBench | 83.809 / 17Thinking (No Tools) | 80.9013 / 17Thinking (No Tools) | +2.90 |
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| IF Bench | 74.205 / 27Thinking (No Tools) | 76.502 / 27Thinking (No Tools) | -2.30 |
| 评测项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B | 分差 |
|---|---|---|---|
| AA-LCR | 68.306 / 13Thinking (No Tools) | 68.705 / 13Thinking (No Tools) | -0.40 |
| 字段 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B |
|---|---|---|
| 发布机构 | 阿里巴巴 | 阿里巴巴 |
| 发布时间 | 2026-03-31 | 2026-02-16 |
| 模型类型 | 聊天大模型 | 多模态大模型 |
| 架构 | 稠密模型 | MoE 架构 |
| 参数规模 | 0.0 | 397.0 |
| 上下文长度 | 1M | 256K |
| 最大输出 | 65536 | 暂无数据 |
价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。
| 价格项 | Qwen 3.6 Plus Preview | Qwen3.5-397B-A17B |
|---|---|---|
| 文本输入 | $0.5 / 1M tokens | $0.5 / 1M tokens |
| 文本输出 | $3 / 1M tokens | $3 / 1M tokens |
| 缓存读取 | $0.05 / 1M tokens | $0.05 / 1M tokens |
| 缓存写入 | $0.625 / 1M tokens | $0.625 / 1M tokens |
14 个共同 benchmark 上,Qwen 3.6 Plus Preview 平均高出 2.59 分。
单项差距最大的 benchmark:Terminal Bench 2.0 — Qwen 3.6 Plus Preview 61.60,Qwen3.5-397B-A17B 52.50(分差 +9.10)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。
| 78.8016 / 103Thinking (With Tools) |
| 76.4024 / 103Thinking (With Tools) |
| +2.40 |