Qwen3-Next-80B-A3B
Qwen3-Next-80B-A3B 是由 阿里巴巴 发布的 AI 模型,发布时间为 2025-09-11,定位为 聊天大模型,参数规模约为 800.0B,上下文长度为 256K,采用 Apache 2.0 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.5 | $6 |
Qwen3-Next 当前已收录的代表性评测结果包括 Creative Writing(9 / 22,得分 85.30)、BBH(10 / 20,得分 87.13)、GSM8K(13 / 26,得分 90.30)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Qwen3-Next是9月9日阿里在推特上泄露的Qwen3家族的新模型,根据爆料显示,该模型总参数800亿,但是激活参数只有30亿,是一个极其稀疏的MoE架构模型。它的效果比Qwen3-32B更好,但是吞吐量是Qwen3-32B的10倍,推理速度也快很多,是阿里Qwen系列的全新架构。
关于Qwen3-Next-80B-A3B模型更多的信息和介绍,参考DataLearnerAI的博客介绍: https://www.datalearner.com/blog/1051757449442911
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
