Qwen3.6-27BvsGemini 3.0 Flash
Qwen3.6-27B 与 Gemini 3.0 Flash 在 6 个共同 benchmark 中整体接近:Qwen3.6-27B 领先 3 项,Gemini 3.0 Flash 领先 3 项,持平 0 项,平均分差 -1.88。
Qwen3.6-27B
阿里巴巴 · 2026-04-22 · 推理大模型
Gemini 3.0 Flash
Google Deep Mind · 2025-12-17 · 聊天大模型
Qwen3.6-27B3 项(50%)(50%)3 项Gemini 3.0 Flash
评测分数
按能力类目分组,每组内按分差大小排列;共 6 项。
Coding and Software Engineer
Qwen3.6-27B 领先 2/2| 评测项 | Qwen3.6-27B | Gemini 3.0 Flash | 分差 |
|---|---|---|---|
| SWE-bench Verified | 77.2025 / 108Thinking (With Tools) | 68.7062 / 108 | +8.50 |
| SWE-Bench Pro - Public | 53.5024 / 43Thinking (With Tools) | 49.6032 / 43Thinking High (With Tools) | +3.90 |
General Knowledge
Gemini 3.0 Flash 领先 2/2| 评测项 | Qwen3.6-27B | Gemini 3.0 Flash | 分差 |
|---|---|---|---|
| HLE | 2492 / 157Thinking (No Tools) | 43.5038 / 157 | -19.50 |
| GPQA Diamond | 87.8033 / 178Thinking (No Tools) | 90.4017 / 178 | -2.60 |
AI Agent - Tool Usage
Qwen3.6-27B 领先 1/1| 评测项 | Qwen3.6-27B | Gemini 3.0 Flash | 分差 |
|---|---|---|---|
| Terminal Bench 2.0 | 59.3020 / 46Thinking (With Tools) | 47.6037 / 46 | +11.70 |
Claw-style Agent Evaluation
Gemini 3.0 Flash 领先 1/1| 评测项 | Qwen3.6-27B | Gemini 3.0 Flash | 分差 |
|---|---|---|---|
| Claw Bench | 72.4027 / 29Thinking (With Tools) | 85.7015 / 29Thinking (With Tools) | -13.30 |
规格对比
| 字段 | Qwen3.6-27B | Gemini 3.0 Flash |
|---|---|---|
| 发布机构 | 阿里巴巴 | Google Deep Mind |
| 发布时间 | 2026-04-22 | 2025-12-17 |
| 模型类型 | 推理大模型 | 聊天大模型 |
| 架构 | 稠密模型 | 稠密模型 |
| 参数规模 | 270亿 | 暂无数据 |
| 上下文长度 | 128K | 2000K |
| 最大输出 | 16K | 64K |
小结
- Qwen3.6-27B在以下类目领先:Coding and Software Engineer (2/2)、AI Agent - Tool Usage (1/1)
- Gemini 3.0 Flash在以下类目领先:General Knowledge (2/2)、Claw-style Agent Evaluation (1/1)
6 个共同 benchmark 上,Gemini 3.0 Flash 平均高出 1.88 分。
单项差距最大的 benchmark:HLE — Qwen3.6-27B 24,Gemini 3.0 Flash 43.50(分差 -19.50)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。