Qwen3.6-27BvsHaiku 4.5

在 8 个共同 benchmark 中，Qwen3.6-27B 整体领先：Qwen3.6-27B 领先 7 项，Haiku 4.5 领先 1 项，持平 0 项，平均分差 +15.50。

阿里巴巴 · 2026-04-22 · 推理大模型

Anthropic · 2025-10-15 · 多模态大模型

Qwen3.6-27B7 项(88%)(13%)1 项Haiku 4.5

评测分数

按能力类目分组，每组内按分差大小排列；共 8 项。

Qwen3.6-27B 领先 4/4

评测项	Qwen3.6-27B	Haiku 4.5	分差
GPQA Diamond	87.8036 / 187Thinking (No Tools)	60.50144 / 187Normal (No Tools)	+27.30
LiveBench	65.5652 / 115Normal (No Tools)	45.33103 / 115Normal (No Tools)	+20.23
HLE	24107 / 172Thinking (No Tools)	4.30170 / 172Normal (No Tools)	+19.70
MMLU Pro	86.2017 / 132Thinking (No Tools)	7681 / 132Normal (No Tools)	+10.20

Qwen3.6-27B 领先 3/3

评测项	Qwen3.6-27B	Haiku 4.5	分差
LiveCodeBench	83.9019 / 123Thinking (No Tools)	5193 / 123Normal (No Tools)	+32.90
SWE-bench Verified	77.2028 / 112Thinking (With Tools)	60.6080 / 112Normal (With Tools)	+16.60
SWE-Bench Pro - Public	53.5034 / 54Thinking (With Tools)	39.4551 / 54Extended (with tools)	+14.05

Haiku 4.5 领先 1/1

评测项	Qwen3.6-27B	Haiku 4.5	分差
Claw Bench	72.4027 / 29Thinking (With Tools)	89.4011 / 29Thinking (With Tools)	-17

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

部分模型公开价格不完整，缺失字段按"暂无公开价格"展示。

8 个共同 benchmark 上，Qwen3.6-27B 平均高出 15.50 分。

单项差距最大的 benchmark：LiveCodeBench — Qwen3.6-27B 83.90，Haiku 4.5 51（分差 +32.90）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。