Qwen 3.6 Plus PreviewvsQwen3.5-397B-A17B

在 15 个共同 benchmark 中，Qwen 3.6 Plus Preview 整体领先：Qwen 3.6 Plus Preview 领先 12 项，Qwen3.5-397B-A17B 领先 3 项，持平 0 项，平均分差 +2.33。

阿里巴巴 · 2026-03-31 · 聊天大模型

阿里巴巴 · 2026-02-16 · 多模态大模型

Qwen 3.6 Plus Preview12 项(80%)(20%)3 项Qwen3.5-397B-A17B

评测分数

按能力类目分组，每组内按分差大小排列；共 15 项。

Qwen 3.6 Plus Preview 领先 4/4

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
SWE-Bench Pro - Public	56.6020 / 54Thinking (With Tools)	50.9039 / 54Thinking (No Tools)	+5.70
SWE-bench Multilingual	73.809 / 23Thinking (No Tools)	69.3020 / 23Thinking (No Tools)	+4.50
LiveCodeBench	87.1010 / 123Thinking (No Tools)	83.6020 / 123Thinking (No Tools)	+3.50
SWE-bench Verified	78.8021 / 112Thinking (With Tools)	76.4033 / 112Thinking (With Tools)	+2.40

Qwen 3.6 Plus Preview 领先 4/4

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
HLE	50.6024 / 172Thinking (With Tools)	48.3035 / 172Thinking (With Tools + Internet)	+2.30
GPQA Diamond	90.4019 / 187Thinking (No Tools)	88.4029 / 187Thinking (No Tools)	+2
MMLU Pro	88.505 / 132Thinking (No Tools)	87.8010 / 132Thinking (No Tools)	+0.70
C-Eval	93.302 / 10Thinking (No Tools)	933 / 10Thinking (No Tools)	+0.30

Qwen 3.6 Plus Preview 领先 2/2

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
Terminal Bench 2.0	61.6016 / 47Thinking (With Tools)	52.5030 / 47Thinking (With Tools)	+9.10
Tool Decathlon	39.806 / 9Thinking (With Tools)	38.307 / 9Thinking (With Tools)	+1.50

Qwen3.5-397B-A17B 领先 2/2

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
LongBench v2	623 / 11Normal (No Tools)	63.202 / 11Normal (No Tools)	-1.20
AA-LCR	68.308 / 15Thinking (No Tools)	68.707 / 15Thinking (No Tools)	-0.40

Qwen 3.6 Plus Preview 领先 2/2

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
AIME 2026	95.304 / 18Thinking (No Tools)	91.3013 / 18Thinking (No Tools)	+4
IMO-AnswerBench	83.8012 / 21Thinking (No Tools)	80.9017 / 21Thinking (No Tools)	+2.90

Qwen3.5-397B-A17B 领先 1/1

评测项	Qwen 3.6 Plus Preview	Qwen3.5-397B-A17B	分差
IF Bench	74.207 / 30Thinking (No Tools)	76.504 / 30Thinking (No Tools)	-2.30

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

Qwen 3.6 Plus Preview在以下类目领先:Coding and Software Engineer (4/4)、General Knowledge (4/4)、AI Agent - Tool Usage (2/2)、Math and Reasoning (2/2)
Qwen3.5-397B-A17B在以下类目领先:Long Context (2/2)、Instruction Following (1/1)

15 个共同 benchmark 上，Qwen 3.6 Plus Preview 平均高出 2.33 分。

单项差距最大的 benchmark：Terminal Bench 2.0 — Qwen 3.6 Plus Preview 61.60，Qwen3.5-397B-A17B 52.50（分差 +9.10）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。