加载中...
加载中...
Cursor Composer 1.5
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Composer 1.5 当前已收录的代表性评测结果包括 Terminal Bench 2.0(18 / 27,得分 47.90)、SWE-bench Multilingual(3 / 3,得分 65.90)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Cursor Composer 1.5 是由 AI 编程平台 Cursor (Anysphere) 于 2026 年 2 月 9 日正式发布的 Agentic (智能体) 编程大模型。作为 Composer 1 的大幅跃升版本,它专门针对日常代码库交互、文件编辑与终端操作进行了深度强化学习 (RL) 优化,其核心目标是在日常交互式编程中实现“响应速度”与“代码智能”的极致平衡。
该模型采用了混合专家 (MoE) 架构(具体参数量暂未公开),并支持高达 200K tokens 的长上下文窗口。其在架构层面的一个核心突破是具备自我总结 (Self-summarization) 能力——在处理涉及多文件的冗长任务且上下文即将耗尽时,模型能够智能且递归地生成上下文摘要。这使其在应对不断变化的上下文长度时,依然能维持极高的准确率和问题解决能力。
Composer 1.5 仅支持文本/代码模态,并在系统级深度支持思考模式 (Thinking Mode)。其突出的能力在于“自适应思考 (Adaptive thinking)”:在处理基础的日常编码时,它能像常规模型一样极速下发代码修改建议;而面对深层 bug 排查或高难度的系统逻辑重构时,模型会自动延长思考时间(Thinking tokens),在内部彻底梳理代码库逻辑和规划操作路径后再进行输出。
官方公布的数据显示,在经过额外 20 倍计算量的强化学习后,Composer 1.5 在各主流代码基准中均大幅超越了前代产品。在由 Laude Institute 维护、侧重于终端代理操作的 Terminal-Bench 2.0 评测中,Composer 1.5 获得了 47.9 分(前代为 40.0 分)。在 SWE-bench Multilingual 多语言工程基准中达到了 65.9 分,在内部评估真实世界编程问题的 CursorBench 体系中获得了 44.2 分。
推荐用例: 官方推荐将其作为日常开发流的首选交互式代理模型。它在代码片段生成、工具调用、语义检索、文件批量修改以及终端命令的自动执行上表现极为出色,能够让开发者保持顺畅的“心流”状态。
已知局限: 根据官方说明,在涉及复杂的“从零到一 (zero-to-one)”全新架构搭建、重度配置文件的深度编写,以及需要代理连续运行数小时乃至数天的极长视距任务上,它依然较弱于顶级通用大模型(如 GPT-5.4 或 Opus 4.6)。
Composer 1.5 为未开源模型,目前独家深度集成于 Cursor IDE 软件内部。在独立 API 定价换算上,其使用成本为:输入请求 $3.50/1M tokens,输出结果 $17.50/1M tokens,并支持 Cache Read 折扣($0.35/1M tokens)。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
