QW

Qwen3-Next

Qwen3-Next-80B-A3B

发布时间: 2025-09-111,620
模型参数
800.0亿
上下文长度
256K
中文支持
支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
256K tokens
最大输出长度
32768 tokens
模型类型
暂无数据
发布时间
2025-09-11
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
800.0 亿 / 30 亿
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
暂无GitHub开源地址

官方介绍与博客

API接口信息

接口速度
4/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.5$6

评测得分

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
BBHnormal
87.13
9 / 18
MMLUnormal
84.72
37 / 59
MMLU Pronormal
66.05
83 / 109
LiveBenchthinking
64.57
34 / 52
GPQAnormal
43.43
9 / 13

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
GSM8Knormal
90.30
12 / 24
AIME2025normal
69.50
69 / 100
MATHnormal
62.36
28 / 41

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
56.60
57 / 99

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
85.30
9 / 22

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
49.80
20 / 22

发布机构

模型解读

Qwen3-Next是9月9日阿里在推特上泄露的Qwen3家族的新模型,根据爆料显示,该模型总参数800亿,但是激活参数只有30亿,是一个极其稀疏的MoE架构模型。它的效果比Qwen3-32B更好,但是吞吐量是Qwen3-32B的10倍,推理速度也快很多,是阿里Qwen系列的全新架构。


关于Qwen3-Next-80B-A3B模型更多的信息和介绍,参考DataLearnerAI的博客介绍: https://www.datalearner.com/blog/1051757449442911 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码