加载中...
加载中...
Qwen3-Next-80B-A3B
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.5 | $6 |
Qwen3-Next是9月9日阿里在推特上泄露的Qwen3家族的新模型,根据爆料显示,该模型总参数800亿,但是激活参数只有30亿,是一个极其稀疏的MoE架构模型。它的效果比Qwen3-32B更好,但是吞吐量是Qwen3-32B的10倍,推理速度也快很多,是阿里Qwen系列的全新架构。
关于Qwen3-Next-80B-A3B模型更多的信息和介绍,参考DataLearnerAI的博客介绍: https://www.datalearner.com/blog/1051757449442911
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
