Qwen3.6-27BvsHaiku 4.5
在 7 个共同 benchmark 中,Qwen3.6-27B 整体领先:Qwen3.6-27B 领先 6 项,Haiku 4.5 领先 1 项,持平 0 项,平均分差 +14.82。
Qwen3.6-27B
阿里巴巴 · 2026-04-22 · 推理大模型
Haiku 4.5
Anthropic · 2025-10-15 · 多模态大模型
Qwen3.6-27B6 项(86%)(14%)1 项Haiku 4.5
评测分数
按能力类目分组,每组内按分差大小排列;共 7 项。
Coding and Software Engineer
Qwen3.6-27B 领先 3/3| 评测项 | Qwen3.6-27B | Haiku 4.5 | 分差 |
|---|---|---|---|
| LiveCodeBench | 83.9019 / 120Thinking (No Tools) | 5191 / 120Normal (No Tools) | +32.90 |
| SWE-bench Verified | 77.2025 / 108Thinking (With Tools) | 60.6076 / 108Normal (With Tools) | +16.60 |
| SWE-Bench Pro - Public | 53.5024 / 43Thinking (With Tools) | 39.4540 / 43Extended (with tools) | +14.05 |
General Knowledge
Qwen3.6-27B 领先 3/3| 评测项 | Qwen3.6-27B | Haiku 4.5 | 分差 |
|---|---|---|---|
| GPQA Diamond | 87.8033 / 178Thinking (No Tools) | 60.50138 / 178Normal (No Tools) | +27.30 |
| HLE | 2492 / 157Thinking (No Tools) | 4.30155 / 157Normal (No Tools) | +19.70 |
| MMLU Pro | 86.2016 / 126Thinking (No Tools) | 7678 / 126Normal (No Tools) | +10.20 |
Claw-style Agent Evaluation
Haiku 4.5 领先 1/1| 评测项 | Qwen3.6-27B | Haiku 4.5 | 分差 |
|---|---|---|---|
| Claw Bench | 72.4027 / 29Thinking (With Tools) | 89.4011 / 29Thinking (With Tools) | -17 |
规格对比
| 字段 | Qwen3.6-27B | Haiku 4.5 |
|---|---|---|
| 发布机构 | 阿里巴巴 | Anthropic |
| 发布时间 | 2026-04-22 | 2025-10-15 |
| 模型类型 | 推理大模型 | 多模态大模型 |
| 架构 | 稠密模型 | 稠密模型 |
| 参数规模 | 270亿 | 暂无数据 |
| 上下文长度 | 128K | 200K |
| 最大输出 | 16K | 64K |
小结
- Qwen3.6-27B在以下类目领先:Coding and Software Engineer (3/3)、General Knowledge (3/3)
- Haiku 4.5在以下类目领先:Claw-style Agent Evaluation (1/1)
7 个共同 benchmark 上,Qwen3.6-27B 平均高出 14.82 分。
单项差距最大的 benchmark:LiveCodeBench — Qwen3.6-27B 83.90,Haiku 4.5 51(分差 +32.90)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。