Qwen3-235B-A22B-Thinking-2507
Qwen3-235B-A22B-Thinking-2507 是由 阿里巴巴 发布的 AI 模型,发布时间为 2025-07-25,定位为 推理大模型,参数规模约为 2350.0B,上下文长度为 256K,模型文件大小约 470.77 GB,采用 Apache 2.0 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | $0.7 | $8.4 |
Qwen3-235B-A22B-Thinking-2507 当前已收录的代表性评测结果包括 MMLU Pro(26 / 116,得分 84.40)、Creative Writing(5 / 22,得分 86.10)、LiveCodeBench(32 / 109,得分 74.10)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
| 变体名称 | 版本类型 | 量化类型 | 模型大小 | HuggingFace 地址 |
|---|---|---|---|---|
| Qwen3-235B-A22B-Thinking-2507-FP8ℹ️ | Instruct | FP8 | 236.45 GB | 下载地址 |
阿里巴巴开源的Qwen3-235B-A22B模型的升级版本,最早的Qwen3-235B-A22B模型是在2025年4月28日随着Qwen3系列一起发布,当时是推理和非推理模式混合的架构模型,后来阿里发现这个模式不好,因此在2025年7月份发布了更新版的模型,即不支持推理模式的Qwen3-235B-A22B-2507和支持推理模式的Qwen3-235B-A22B-Thinking-2507。
Qwen3-235B-A22B-Thinking-2507最多可以支持80K的推理过程长度,最高支持32K的答案输出,是当前推理过程最长的模型之一!
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
