QW

Qwen3-Coder-Next

编程大模型Qwen3

Qwen3-Coder-Next

发布时间: 2026-02-03更新于: 2026-03-08 21:06:202,307
模型参数
80亿
上下文长度
256K
中文支持
支持
推理能力

Qwen3-Coder-Next 是由 阿里巴巴 发布的 AI 模型,发布时间为 2026-02-03,定位为 编程大模型,参数规模约为 80亿,上下文长度为 256K,模型文件大小约 48GB,采用 Qwen License 许可,在 Pinch Bench 上取得 79.10 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen3-Coder-Next

模型基本信息

推理过程
不支持
思考模式
思考水平 · 扩展 (Extended) (默认)常规模式
上下文长度
256K tokens
最大输出长度
64K tokens
模型类型
编程大模型
输入/输出模态
文本 → 文本
发布时间
2026-02-03
模型文件大小
48GB
MoE架构
总参数 / 激活参数
80亿 / 3亿
知识截止
暂无数据
Qwen3-Coder-Next

开源和体验地址

代码开源状态
预训练权重开源
Qwen License- 免费商用授权
在线体验
暂无在线体验地址
Qwen3-Coder-Next

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Qwen3-Coder-Next

API接口信息

接口速度
5/5
暂无公开的 API 定价信息。
Qwen3-Coder-Next

评测结果

Qwen3-Coder-Next 当前已收录的代表性评测结果包括 SWE-bench Verified(53 / 108,得分 70.60)、Aider-Polyglot(14 / 26,得分 66.20)、Pinch Bench(25 / 37,得分 79.10)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
工具使用

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
66.20
14 / 26

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
36.20
45 / 46

OpenClaw智能体能力综合测评

共 2 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
思考模式工具
79.10
25 / 37
Claw Bench
思考模式工具
75.80
24 / 29

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Qwen3-Coder-Next

发布机构

Qwen3-Coder-Next

模型解读

1. Qwen3-Coder-Next 简介与核心特点

基本信息:Qwen3-Coder-Next 是由 Qwen 团队(阿里云)于 2026 年 2 月 3 日正式发布的最新一代代码语言模型。该模型属于 Qwen3 系列,定位为专为代码智能体(Coding Agents)和本地开发环境设计的轻量级、高性能模型。

核心目标:Qwen3-Coder-Next 旨在通过创新的架构设计,在保持极低推理成本和显存占用的同时,提供足以媲美大参数量模型的代码生成、工具调用和长程推理能力,特别优化了在 Agentic workflows(智能体工作流)中的表现。

2. 架构与技术规格

  • 模型参数:总参数量 80B(800亿)。
  • 激活参数量:约 3B(30亿)。采用稀疏混合专家(Sparse MoE)架构,结合了混合注意力机制(Hybrid Attention)。
  • 架构特点:
    • 混合注意力(Hybrid Attention):结合了 Gated DeltaNet 和 Gated Attention,以平衡推理速度与长上下文记忆能力。
    • MoE 设计:包含 512 个专家(Experts),每 token 激活 10 个专家 + 1 个共享专家。这种 A3B(Active 3B)设计使其在推理时仅需极少的计算资源。
  • 上下文窗口:原生支持 256K tokens,适合处理大型代码库、复杂的调试日志以及长周期的智能体交互任务。
  • 训练数据:在基础模型 Qwen3-Next-80B-A3B 的基础上,针对海量可执行任务(Executable Tasks)、环境交互数据以及强化学习(RL)进行了大规模的 Post-training 优化。

3. 核心能力与支持模态

  • 模态支持:纯文本模型(Text-in, Text-out),专注于代码与自然语言的交互。
  • 能力详述:
    • 代码生成与补全:具备强大的 Fill-in-the-Middle (FIM) 能力,支持多种编程语言的精确生成。
    • 智能体能力(Agentic Capabilities):擅长规划、工具调用(Tool Use)以及从运行时错误中自我修正。官方报告指出其在多轮交互和长程推理任务中表现优异。
    • IDE 集成:由于其高效的推理速度(本地部署友好),特别适合集成到 VS Code、Cursor 等 IDE 插件中作为实时 Copilot 使用。

4. 性能与基准评测

根据官方及社区的早期评测,Qwen3-Coder-Next 在 SWE-Bench Pro 等基准测试中展现了令人印象深刻的性能,其表现可与拥有 10-20 倍激活参数量的密集型模型(Dense Models)相媲美。在本地部署场景下(如使用 4-bit 量化),它能在消费级显卡(如 24GB-48GB 显存范围)上实现高吞吐量推理。

5. 应用场景与限制

  • 推荐用例:本地代码助手、自动化代码重构代理、复杂的 CI/CD 故障排查智能体、以及需要低延迟响应的实时编程辅助。
  • 已知局限:作为一个专注于“快”和“Agent”的模型,它不支持“深度思考(Thinking Mode)”输出,不产生思维链(CoT)块,更倾向于直接执行和结果输出。

6. 访问方式与许可

访问方式:模型权重已在 Hugging Face 和 ModelScope 开源,开发者可通过 GitHub 获取推理代码,并支持通过 vLLM、SGLang 或 Unsloth 等框架进行部署。

许可协议:遵循 Qwen License(以官方仓库最新声明为准),通常允许在一定条件下的商用。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码