Qwen3.6-27BvsQwen3.5-27B

在 8 个共同 benchmark 中，Qwen3.6-27B 整体领先：Qwen3.6-27B 领先 6 项，Qwen3.5-27B 领先 2 项，持平 0 项，平均分差 +0.21。

阿里巴巴 · 2026-04-22 · 推理大模型

阿里巴巴 · 2026-02-25 · 推理大模型

Qwen3.6-27B6 项(75%)(25%)2 项Qwen3.5-27B

评测分数

按能力类目分组，每组内按分差大小排列；共 8 项。

Qwen3.6-27B 领先 3/4

评测项	Qwen3.6-27B	Qwen3.5-27B	分差
HLE	24107 / 172Thinking (No Tools)	48.5033 / 172Thinking (With Tools)	-24.50
GPQA Diamond	87.8036 / 187Thinking (No Tools)	85.5052 / 187Thinking (No Tools)	+2.30
C-Eval	91.405 / 10Thinking (No Tools)	90.506 / 10Thinking (No Tools)	+0.90
MMLU Pro	86.2017 / 132Thinking (No Tools)	86.1019 / 132Thinking (No Tools)	+0.10

Qwen3.6-27B 领先 2/2

评测项	Qwen3.6-27B	Qwen3.5-27B	分差
SWE-bench Verified	77.2028 / 112Thinking (With Tools)	72.4053 / 112Thinking (No Tools)	+4.80
LiveCodeBench	83.9019 / 123Thinking (No Tools)	80.7027 / 123Thinking (With Tools)	+3.20

Qwen3.6-27B 领先 1/1

评测项	Qwen3.6-27B	Qwen3.5-27B	分差
Terminal Bench 2.0	59.3020 / 47Thinking (With Tools)	41.6043 / 47Thinking (With Tools)	+17.70

Qwen3.5-27B 领先 1/1

评测项	Qwen3.6-27B	Qwen3.5-27B	分差
Claw Bench	72.4027 / 29Thinking (With Tools)	75.2026 / 29Thinking (With Tools)	-2.80

Qwen3.6-27B在以下类目领先:General Knowledge (3/4)、Coding and Software Engineer (2/2)、AI Agent - Tool Usage (1/1)
Qwen3.5-27B在以下类目领先:Claw-style Agent Evaluation (1/1)

8 个共同 benchmark 上，Qwen3.6-27B 平均高出 0.21 分。

单项差距最大的 benchmark：HLE — Qwen3.6-27B 24，Qwen3.5-27B 48.50（分差 -24.50）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。