QW

Qwen3-235B-A22B

Qwen3-235B-A22B

发布时间: 2025-04-281,473
模型参数
2350.0亿
上下文长度
128K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
128K tokens
最大输出长度
16384 tokens
模型类型
暂无数据
发布时间
2025-04-28
模型文件大小
470GB
MoE架构
总参数 / 激活参数
2350.0 亿 / 220 亿
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权

官方介绍与博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.7$8.4

评测得分

综合评估

共 7 项评测
评测名称 / 模式
得分
排名/总数
BBHnormal
88.87
8 / 18
MMLUnormal
85.80
31 / 59
MMLU Pronormal
72.90
68 / 109
71.10
71 / 140
GPQA Diamondthinking
71.10
71 / 140
HLEnormal
7.60
67 / 81
ARC-AGInormal
4.30
36 / 36

数学推理

共 7 项评测
评测名称 / 模式
得分
排名/总数
MATH-500thinking
98
7 / 42
GSM8Knormal
96.40
2 / 24
MATH-500normal
96.20
18 / 42
AIME 2024normal
85.70
20 / 62
AIME 2024thinking
85.70
20 / 62
AIME2025thinking
81.50
47 / 100
AIME2025normal
24.70
97 / 100

阅读理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
DROPnormal
88.70
5 / 6

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQAnormal
11
37 / 44

编程与软件工程

共 3 项评测
评测名称 / 模式
得分
排名/总数
70.70
30 / 99
70.70
30 / 99
34.40
68 / 72

写作和创作

共 2 项评测
评测名称 / 模式
得分
排名/总数
84.60
11 / 22
80.40
18 / 22

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Benchthinking
31
19 / 25

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Benchthinking + 使用工具
34.40
27 / 28

发布机构

模型解读

Qwen3-235B-A22B是阿里开源的第三代千问大模型最大参数规模的版本,共2350亿参数,但是这是MoE(混合专家)架构的大模型,每次推理仅激活其中的220亿参数。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码