QW

Qwen3-235B-A22B-Thinking-2507

Qwen3-235B-A22B-Thinking-2507

发布时间: 2025-07-251,004
模型参数
2350.0亿
上下文长度
256K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
256K tokens
最大输出长度
32768 tokens
模型类型
暂无数据
发布时间
2025-07-25
模型文件大小
470.77 GB
MoE架构
总参数 / 激活参数
2350.0 亿 / 220 亿
知识截止
暂无数据
推理模式
思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权

官方介绍与博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.7$8.4

评测得分

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
MMLU Prothinking
84.40
21 / 109
GPQA Diamondthinking
81.10
33 / 140
LiveBenchthinking
69.11
23 / 52
HLEthinking
18.20
41 / 81

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
74.10
22 / 99

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025thinking
92.30
28 / 100

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
86.10
5 / 22

模型变体及不同版本下载

变体名称版本类型量化类型模型大小HuggingFace 地址
Qwen3-235B-A22B-Thinking-2507-FP8ℹ️InstructFP8236.45 GB下载地址

发布机构

模型解读

阿里巴巴开源的Qwen3-235B-A22B模型的升级版本,最早的Qwen3-235B-A22B模型是在2025年4月28日随着Qwen3系列一起发布,当时是推理和非推理模式混合的架构模型,后来阿里发现这个模式不好,因此在2025年7月份发布了更新版的模型,即不支持推理模式的Qwen3-235B-A22B-2507和支持推理模式的Qwen3-235B-A22B-Thinking-2507。


Qwen3-235B-A22B-Thinking-2507最多可以支持80K的推理过程长度,最高支持32K的答案输出,是当前推理过程最长的模型之一!

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码