QW

Qwen3-235B-A22B-Thinking

Qwen3-235B-A22B-Thinking-2507

发布时间: 2025-07-30676
模型参数
305.0亿
上下文长度
256K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
256K tokens
最大输出长度
16384 tokens
模型类型
暂无数据
发布时间
2025-07-30
模型文件大小
31.17GB
MoE架构
总参数 / 激活参数
305.0 亿 / 33 亿
知识截止
暂无数据
推理模式
思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权

官方介绍与博客

DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.2$2.4

评测得分

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
MMLU Prothinking
84.40
21 / 109
GPQA Diamondthinking
81.10
33 / 140
LiveBenchthinking
63.42
39 / 52
HLEthinking
18.20
41 / 81

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
74.10
22 / 99

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
AIME2025thinking
92.30
28 / 100
33.30
6 / 16
5.20
5 / 8

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
86.10
5 / 22

发布机构

模型解读

Qwen3-235B-A22B-Thinking-2507是阿里开源的Qwen3-30B-A3B模型升级版本,前者是2025年4月28日阿里开源的混合思考模式的模型(即一个模型支持推理和非推理模式),三个月后阿里发布了新版本,将其拆分为只支持推理和不支持推理的两个版本。Qwen3-235B-A22B-Thinking-2507是其中仅支持推理模式的版本,但是效果提升明显。


Qwen3-235B-A22B-Thinking-2507模型与其它模型的评测结果对比:

 https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,42,44&modelInputString=642,641,562,567,566 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码