Qw

Qwen3-Next

聊天大模型

Qwen3-Next-80B-A3B

发布时间: 2025-09-11

1,445
模型参数(Parameters)
800.0
最高上下文长度(Context Length)
256K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

256K tokens

最长输出结果

32768 tokens

模型类型

聊天大模型

发布时间

2025-09-11

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0 - 免费商用授权
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 0.5 美元/100万 tokens 6 美元/100万 tokens

Qwen3-Next模型在各大评测榜单的评分

综合评估

共 5 项评测
BBH normal
87.13
9 / 18
MMLU normal
84.72
37 / 59
MMLU Pro normal
66.05
79 / 105
LiveBench thinking
64.57
31 / 48
GPQA normal
43.43
9 / 13

数学推理

共 3 项评测
GSM8K normal
90.30
12 / 24
AIME2025 normal
69.50
62 / 93
MATH normal
62.36
28 / 41

编程与软件工程

共 1 项评测
LiveCodeBench normal
56.60
52 / 94

写作和创作

共 1 项评测
85.30
9 / 22

Agent能力评测

共 1 项评测
49.80
20 / 22

发布机构

Qwen3-Next-80B-A3B模型解读

Qwen3-Next是9月9日阿里在推特上泄露的Qwen3家族的新模型,根据爆料显示,该模型总参数800亿,但是激活参数只有30亿,是一个极其稀疏的MoE架构模型。它的效果比Qwen3-32B更好,但是吞吐量是Qwen3-32B的10倍,推理速度也快很多,是阿里Qwen系列的全新架构。


关于Qwen3-Next-80B-A3B模型更多的信息和介绍,参考DataLearnerAI的博客介绍: https://www.datalearner.com/blog/1051757449442911 

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat