DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

为什么Qwen3系列模型中没有720亿参数规模的Qwen3-72B?Qwen3-72B还会发布吗?NO!

2025/06/18 16:23:24
1,828 阅读
QwenQwen2.572BQwen3千问大模型

Qwen3是阿里在2025年6月份开源的最新Qwen系列大模型,包含了8个不同参数规模的大模型,最大达到2350亿参数规模,最小仅6亿参数规模。本次发布的Qwen3系列是推理大模型和常规的大模型混合版本。

不过这个系列中没有Qwen3-72B这个版本,而Qwen 72B一直是此前Qwen系列中最强的,如Qwen2.5-72B,一直是开源模型中的标杆,也是开源领域稠密模型参数最高的一类(所谓稠密模型就是非MoE架构)。但很多人依然关心还有没有Qwen3-72B模型?阿里什么时候会发布Qwen3-72B模型,答案是可能再也没有了!

阿里取消了72B这个参数规模的Qwen模型的主要原因在于阿里发现,当模型参数规模超过300亿(30B)的时候,稠密模型的训练和推理效果以及推理效率都非常难优化,因此,超过30B规模的模型,阿里选择使用MoE架构。因此,从Qwen3开始,阿里取消了72B版本的Qwen模型。

上图是阿里Qwen大模型工程师在X的回复。

当然官方说Qwen3-32B模型的能力已经超越Qwen2.5-72B了,所以大家可以选择这个版本代替,更高参数规模,就只能选择2350亿参数规模的Qwen3-235B-A22B了。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • 阿里通义千问团队首次开源语音合成大模型:Qwen3-TTS:总共5个模型,最小的仅0.6B参数规模,最大1.8B参数
  • 阿里发布第二代图像大模型:Qwen-Image-2.0,融合文本生成图片、图片编辑为一体全球目前排名第三!中文渲染很棒!但不开源~
  • Qwen Code介绍和使用:阿里开源的命令行AI编程助手,免费开源,支持最高100万的上下文!
  • 向量大模型新选择,阿里开源向量大模型Qwen-Embedding和重排序大模型Qwen-Reranker,开源向量检索能力第一名!完全免费开源。
  • 重磅!第二代通义千问大模型开源,阿里巴巴一口气开源了30个不同参数规模的模型,其中Qwen1.5-72B仅次于GPT-4.
  • 阿里开源最新Qwen-14B:英文理解能力接近LLaMA2-70B,数学推理能力超过GPT-3.5!
  • 重磅!阿里开源2个多模态向量大模型和重排序大模型:Qwen3-VL-Embedding和Qwen3-VL-Reranker,图片和视频也可以用来做RAG了!
  • 模型不能停,阿里又又又又要开源新模型:Qwen3-Next-80B-A3B

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署