Qwen3-235B-A22B-Thinking-2507

Name: Qwen3-235B-A22B-Thinking-2507
Author: 阿里巴巴

推理大模型Qwen3

发布时间: 2025-07-25更新于: 2025-07-27 23:27:051,335

在线体验 GitHub Hugging Face Compare

模型参数

2350亿

上下文长度

256K

中文支持

支持

推理能力

Qwen3-235B-A22B-Thinking-2507 是由阿里巴巴发布的 AI 模型，发布时间为 2025-07-25，定位为推理大模型，参数规模约为 2350亿，上下文长度为 256K，模型文件大小约 470.77 GB，采用 Apache 2.0 许可，在 AIME2025 上取得 92.30 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3-235B-A22B-Thinking-2507

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

256K tokens

最大输出长度

32K tokens

模型类型

推理大模型

输入/输出模态

文本 → 文本

发布时间

2025-07-25

模型文件大小

470.77 GB

MoE架构

是

总参数 / 激活参数

2350亿 / 220亿

知识截止

暂无数据

Qwen3-235B-A22B-Thinking-2507

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3

Hugging Face

https://huggingface.co/Qwen/Qwen3-235B-A22B-Thinking-2507

在线体验

https://chat.qwen.ai/

Qwen3-235B-A22B-Thinking-2507

官方介绍与博客

官方论文

Qwen3-235B-A22B-Instruct-2507

DataLearnerAI博客

阿里发布Qwen3小幅更新版本，放弃混合思考模式，发布全新的2个版本Qwen3-235B-A22B-2507模型，1/5的参数，性能直逼Kimi K2，推理模式版本评测结果接近o3

Qwen3-235B-A22B-Thinking-2507

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

Qwen3-235B-A22B-Thinking-2507

评测结果

Qwen3-235B-A22B-Thinking-2507 当前已收录的代表性评测结果包括 Creative Writing（5 / 23，得分 86.10）、MMLU Pro（34 / 126，得分 84.40）、AIME2025（33 / 106，得分 92.30）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

84.40

34 / 126

GPQA Diamond

81.10

69 / 180

HLE

18.20

115 / 163

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

74.10

41 / 120

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

92.30

33 / 106

FrontierMath - Tier 4

思考模式

72 / 80

写作和创作

共 1 项评测

评测名称 / 模式

得分

排名/总数

Creative Writing

86.10

5 / 23

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Qwen3-235B-A22B-Thinking-2507

模型变体及不同版本下载

变体名称	版本类型	量化类型	模型大小	HuggingFace 地址
Qwen3-235B-A22B-Thinking-2507-FP8ℹ️	Instruct	FP8	236.45 GB	下载地址

Qwen3-235B-A22B-Thinking-2507

发布机构

阿里巴巴

查看发布机构详情

Qwen3-235B-A22B-Thinking-2507

模型解读

阿里巴巴开源的Qwen3-235B-A22B模型的升级版本，最早的Qwen3-235B-A22B模型是在2025年4月28日随着Qwen3系列一起发布，当时是推理和非推理模式混合的架构模型，后来阿里发现这个模式不好，因此在2025年7月份发布了更新版的模型，即不支持推理模式的Qwen3-235B-A22B-2507和支持推理模式的Qwen3-235B-A22B-Thinking-2507。

Qwen3-235B-A22B-Thinking-2507最多可以支持80K的推理过程长度，最高支持32K的答案输出，是当前推理过程最长的模型之一！

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送