Composer 2.5 评测详情
Composer 2.5 当前已收录的代表性评测结果包括 SWE-bench Multilingual(2 / 20,得分 79.80)、Terminal Bench 2.0(7 / 46,得分 69.30)。本页还提供与 3 个竞品模型及 3 个前代或同系列模型的对比,在有数据时会展示性能和价格视图。并附有 1 个数据来源链接供参考。
评测结果
Composer 2.5
评测结果
竞品对比
Composer 2.5 与同类主流模型的评测得分对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;百分制评测使用原始高度,超出 0-100 的评测按该评测内相对比例缩放,标签仍保留原始分数。
2 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。
| 评测项 | Composer 2.5当前 | Opus 4.7 | Kimi K2.6 |
|---|---|---|---|
Terminal Bench 2.0 AI Agent - 工具使用 | 69.30开启思考 | 69.40扩展思考 | 工具 | 66.70开启思考 | 工具 |
SWE-bench Multilingual 编程与软件工程 | 79.80开启思考 | -- | 76.70开启思考 | 工具 |
Composer 2.5 与同类模型的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。 · USD / 1M tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Opus 4.7 | Anthropic | $5 / 1M tokens | $25 / 1M tokens | — |
GPT-5.5 | OpenAI | $5 / 1M tokens | $30 / 1M tokens | — |
Kimi K2.6 | Facebook AI研究实验室 | $0.95 / 1M tokens | $4 / 1M tokens | — |
历代版本对比
Composer 2.5 系列各版本的评测成绩纵向对比
评测类别:
柱状图按当前筛选范围内每个模型在各评测中的最高分展示;百分制评测使用原始高度,超出 0-100 的评测按该评测内相对比例缩放,标签仍保留原始分数。
2 项可对比评测得分汇总。每个模型展示最佳得分,模式在分数下方标注。· 点击任意行可切换下方趋势图。
| 评测项 | Composer 2.5当前 | Composer 2 | Composer 1.5 | Composer 1 |
|---|---|---|---|---|
Terminal Bench 2.0 AI Agent - 工具使用 | 69.30开启思考 | 61.70开启思考 | 47.90开启思考 | 40.00开启思考 |
SWE-bench Multilingual 编程与软件工程 | 79.80开启思考 | 73.70开启思考 | 65.90开启思考 | 56.90开启思考 |
单评测历史趋势图
当前查看:Terminal Bench 2.0 · AI Agent - 工具使用
选择评测
Composer 2.5 所在系列的标准 API 价格对比
按模型并排展示标准文本输入价与输出价;若存在超长上下文加价,仅保留阈值内标准价,并在下方说明适用范围。
数据来源:DataLearnerAI,展示默认供应商的标准文本价格。 · USD / 1M tokens
| 模型 | 供应商 | 标准输入 | 标准输出 | 标准价适用于 |
|---|---|---|---|---|
Composer 2 | Cursor | $0.5 / 1M tokens | $2.5 / 1M tokens | — |
Composer 1.5 | Cursor | $3.5 / 1M tokens | $17.5 / 1M tokens | — |
Composer 1 | Cursor | $1.25 / 1M tokens | $10 / 1M tokens | — |