腾讯发布全新推理大模型Hunyuan-T1:mamba与transformer结合的新架构,与业界模型对比评测结果不错,但是不开源
2025年3月21日,腾讯正式推出其全新大模型Hunyuan-T1,该模型基于此前发布的TurboS快速思维基座,首次采用Hybrid-Transformer-Mamba混合专家架构(MoE),在推理效率、长文本处理及资源消耗优化等方面表现还不错。此外,这个新架构也使得Hunyuan-T1速度非常快,模型支持首字符1秒内响应,生成速度达60-80 token/秒,适用于实时交互场景。

Hunyuan-T1模型概览
Hunyuan-T1是腾讯混元大模型系列中首个面向深度推理场景的官方版本,其前身为2025年2月发布的Hunyuan-T1预览版(Hunyuan-Thinker-1-Preview)。此次升级后,模型通过大规模后训练(Post-training)进一步强化了纯推理能力,并提升了对人类偏好的对齐水平。
在2025年3月10日,腾讯曾经发布过Hunyuan-TurboS模型(参考此前DataLearnerAI的Hunyuan-TurboS的介绍:,也是一个非常不错的非推理版本的大模型,本次发布的Hunyuan-T1的基座就是Hunyuan-TurboS模型。

