加载中...
加载中...
Cursor Composer 2
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 文本 | - | $0.500/ 1M | $2.50/ 1M |
Composer 2 当前已收录的代表性评测结果包括 Terminal Bench 2.0(5 / 27,得分 61.70)、SWE-bench Multilingual(1 / 3,得分 73.70)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Cursor 于 2026 年 3 月 19 日正式发布了 Composer 2,这是其最新专属编码模型。该模型以 Moonshot AI 的 Kimi K2.5 为基础,经过继续预训练(continued pretraining)和强化学习(RL)优化,主要面向 Cursor IDE 中的长时序、代理式编码任务。
Composer 2 支持 200k tokens 上下文窗口,深度集成 Cursor 工具链(文件读写、终端命令执行、浏览器控制、图像处理等),并新增自我总结(self-summarization)机制,帮助模型更好地处理需要数百步操作的复杂工作流。
基准表现(Cursor 官方使用内部 Harbor 等框架测试):
这些提升主要来自首次继续预训练工作,为后续强化学习奠定了更强基础。官方称 Composer 2 在编码代理任务上达到“frontier-level”(前沿级别)性能。
定价(每百万 tokens):
快速版在保持相同智能水平的前提下提供更高吞吐量,Cursor 表示其整体成本低于同等速度的其他前沿模型。个人计划用户可获得独立的 Composer 使用额度,团队/企业版按 API 计费。目前 Composer 2 仅限 Cursor 环境使用(含 Glass 新界面早期 alpha 版),尚未作为独立 API 开放。
Composer 2 发布初期,Cursor 官方博客将其描述为内部开发的模型,重点突出自有的继续预训练和强化学习成果,未提及基础模型来源。
发布后不到 24 小时,开发者通过 Cursor 的 OpenAI 兼容 API 调用发现模型 ID 包含 “kimi-k2p5-rl-0317-s515-fast” 前缀。Cursor 团队成员 Lee Robinson 随后公开确认:Composer 2 以 Moonshot AI 的 Kimi K2.5 作为基础。他们评估了多个候选基础模型后,认为 Kimi K2.5 在困惑度等指标上表现最佳。“最终模型中大约只有四分之一的计算量来自基础模型,其余来自我们的训练。”Cursor 同时表示,最初未说明来源属于疏忽,未来将提高透明度。
Kimi K2.5 是 Moonshot AI 于 2026 年初发布的开源多模态代理模型,采用 Mixture-of-Experts(MoE)架构,支持原生视觉理解、图像/视频输入以及多代理协调能力,在编码和工具调用任务中表现突出。Cursor 在其基础上叠加了针对 IDE 场景的继续预训练和大规模强化学习。
Moonshot AI 官方账号随后回应确认,Kimi K2.5 为 Composer 2 提供了基础,并明确指出:“Cursor 通过 Fireworks AI 托管的 RL 和推理平台访问 Kimi K2.5,作为授权商业合作伙伴关系的一部分。”双方还确认了 tokenizer 完全一致。目前该合作事宜已得到双方公开说明。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
