阿里开源Qwen3-Coder-Next:专为Agentic Coding而生的80B MoE的编程大模型,激活参数仅3B!
就在刚刚,阿里开源了全新一代编程大模型Qwen3-Coder-Next,该模型是基于Qwen3-Next-80B-A3B-Base模型后训练得到,总参数规模800亿,激活参数仅30亿。也就是说,这个模型的推理速度基本和3B这种小规模参数差不多,但是它的评测结果,特别是在编程方面的评测与DeepSeek V3.2的水平差不多。

从官方信息来看,本次开源的 Qwen3-Coder-Next 目标是“agentic coding”:即模型训练目标直接围绕“生成代码 → 执行 → 失败 → 修复 → 再执行”的闭环,而不是只优化单轮代码生成质量。


