Qwen3.5-27B 评测详情
Qwen3.5-27B 当前已收录的代表性评测结果包括 Pinch Bench(2 / 37,得分 90)、IF Bench(2 / 27,得分 76.50)、MMLU Pro(11 / 116,得分 86.10)。本页还提供与 1 个竞品模型及 2 个前代或同系列模型的对比,在有数据时会展示性能和价格视图。并附有 1 个数据来源链接供参考。
评测结果
Qwen3.5-27B
评测结果
综合评估
共 5 项评测评测名称 / 模式
得分
排名/总数
编程与软件工程
共 3 项评测评测名称 / 模式
得分
排名/总数
竞品对比
Qwen3.5-27B 与同类主流模型的评测得分对比
Qwen3.5-27B(当前模型)Gemma 4 31B
评测类别:
Qwen3.5-27B:
思考模式 + 工具
思考模式
Gemma 4 31B:
开启 + 工具
开启 + 工具
开启
评测得分对比
5 项可对比评测得分汇总
| 评测项 | Qwen3.5-27B(本模型) | Gemma 4 31B |
|---|---|---|
GPQA Diamond 综合评估 | 85.50 思考模式(无工具) | 84.30 思考模式(无工具) |
HLE 综合评估 | 48.50 思考模式(工具) | 26.50 思考模式(工具+联网) |
MMLU Pro 综合评估 | 86.10 思考模式(无工具) | 85.20 思考模式(无工具) |
LiveCodeBench 编程与软件工程 | 80.70 思考模式(工具) | 80.00 思考模式(无工具) |
τ²-Bench Agent能力评测 | 79.00 思考模式(工具) | 76.90 思考模式(工具) |
Qwen3.5-27B 与同类模型的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。
这些模型暂未提供可比较的标准文本价格。
历代版本对比
Qwen3.5-27B 系列各版本的评测成绩纵向对比
评测类别:
Qwen3.5-27B:
思考模式 + 工具
思考模式
Qwen3-32B:
normal
Qwen2.5-32B:
normal
评测得分对比
3 项可对比评测得分汇总
| 评测项 | Qwen3.5-27B(本模型) | Qwen3-32B | Qwen2.5-32B |
|---|---|---|---|
GPQA Diamond 综合评估 | 85.50 思考模式(无工具) | 68.40 thinking | -- |
MMLU Pro 综合评估 | 86.10 思考模式(无工具) | -- | 69.23 normal |
LiveCodeBench 编程与软件工程 | 80.70 思考模式(工具) | 65.70 normal | 51.20 normal |
Qwen3.5-27B 所在系列的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。
这些模型的价格币种或计费单位不一致,暂不直接绘制统一柱状图,以下展示原始价格。
Qwen3-32B
标准输入: 0.7 美元/100 万tokens
标准输出: 2.8 美元/100 万tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Qwen3-32B | — | 0.7 美元/100 万tokens | 2.8 美元/100 万tokens | — |
系列版本评测总览
查看 Qwen3.5-27B 系列各版本在主要评测上的整体得分,点击任意评测行可查看各推理模式的细分结果。
提示:点击任意分数单元格可切换下方关系图。
| 评测项 | Qwen2.5-32B2024/9/18 | Qwen3-32B2025/4/28 | Qwen3.5-27B2026/2/25 |
|---|---|---|---|
单评测模式关系图
当前查看:GPQA Diamond · 综合评估
选择评测