Qwen3.6-27BvsGemini 3.0 Flash

Qwen3.6-27B 与 Gemini 3.0 Flash 在 6 个共同 benchmark 中整体接近:Qwen3.6-27B 领先 3 项,Gemini 3.0 Flash 领先 3 项,持平 0 项,平均分差 -1.88。

阿里巴巴
Qwen3.6-27B

阿里巴巴 · 2026-04-22 · 推理大模型

Google Deep Mind
Gemini 3.0 Flash

Google Deep Mind · 2025-12-17 · 聊天大模型

Qwen3.6-27B3 (50%)(50%)3 Gemini 3.0 Flash

评测分数

按能力类目分组,每组内按分差大小排列;共 6 项。

Coding and Software Engineer

Qwen3.6-27B 领先 2/2
评测项Qwen3.6-27BGemini 3.0 Flash分差
SWE-bench Verified77.2025 / 108Thinking (With Tools)68.7062 / 108+8.50
SWE-Bench Pro - Public53.5024 / 43Thinking (With Tools)49.6032 / 43Thinking High (With Tools)+3.90

General Knowledge

Gemini 3.0 Flash 领先 2/2
评测项Qwen3.6-27BGemini 3.0 Flash分差
HLE2492 / 157Thinking (No Tools)43.5038 / 157-19.50
GPQA Diamond87.8033 / 178Thinking (No Tools)90.4017 / 178-2.60

AI Agent - Tool Usage

Qwen3.6-27B 领先 1/1
评测项Qwen3.6-27BGemini 3.0 Flash分差
Terminal Bench 2.059.3020 / 46Thinking (With Tools)47.6037 / 46+11.70

Claw-style Agent Evaluation

Gemini 3.0 Flash 领先 1/1
评测项Qwen3.6-27BGemini 3.0 Flash分差
Claw Bench72.4027 / 29Thinking (With Tools)85.7015 / 29Thinking (With Tools)-13.30

规格对比

字段Qwen3.6-27BGemini 3.0 Flash
发布机构阿里巴巴Google Deep Mind
发布时间2026-04-222025-12-17
模型类型推理大模型聊天大模型
架构稠密模型稠密模型
参数规模270亿暂无数据
上下文长度128K2000K
最大输出16K64K

小结

  • Qwen3.6-27B在以下类目领先:Coding and Software Engineer (2/2)、AI Agent - Tool Usage (1/1)
  • Gemini 3.0 Flash在以下类目领先:General Knowledge (2/2)、Claw-style Agent Evaluation (1/1)

6 个共同 benchmark 上,Gemini 3.0 Flash 平均高出 1.88 分。

单项差距最大的 benchmark:HLE — Qwen3.6-27B 24,Gemini 3.0 Flash 43.50(分差 -19.50)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。