腾讯发布全新推理大模型Hunyuan-T1：mamba与transformer结合的新架构，与业界模型对比评测结果不错，但是不开源

2025年3月21日，腾讯正式推出其全新大模型Hunyuan-T1，该模型基于此前发布的TurboS快速思维基座，首次采用Hybrid-Transformer-Mamba混合专家架构（MoE），在推理效率、长文本处理及资源消耗优化等方面表现还不错。此外，这个新架构也使得Hunyuan-T1速度非常快，模型支持首字符1秒内响应，生成速度达60-80 token/秒，适用于实时交互场景。

Hunyuan-T1模型概览

Hunyuan-T1是腾讯混元大模型系列中首个面向深度推理场景的官方版本，其前身为2025年2月发布的Hunyuan-T1预览版（Hunyuan-Thinker-1-Preview）。此次升级后，模型通过大规模后训练（Post-training）进一步强化了纯推理能力，并提升了对人类偏好的对齐水平。

在2025年3月10日，腾讯曾经发布过Hunyuan-TurboS模型（参考此前DataLearnerAI的Hunyuan-TurboS的介绍：Hunyuan-TurboS模型信息卡，也是一个非常不错的非推理版本的大模型，本次发布的Hunyuan-T1的基座就是Hunyuan-TurboS模型。

Hunyuan TurboS结合了Transformer与Mamba架构的优势，解决了长文本推理中的上下文丢失和长距离信息依赖问题，同时显著降低计算资源消耗。

Hunyuan-T1技术特点与创新

Hunyuan-T1的核心创新点是架构，它是transformer与mamba结合的大模型架构。Mamba 是一种新型的大语言模型架构，由 Albert Gu 和 Tri Dao 等研究者在 2023 年提出。它基于状态空间模型（State Space Models, SSMs），旨在解决传统 Transformer 架构在处理长序列时存在的计算复杂度和内存占用问题，同时通过**选择性机制（Selective Mechanism）**提升模型对上下文的理解能力。

简单来说就是Mamba 就像一个“聪明的快递分拣员”，能快速处理超长的包裹流水线（比如 100 万个包裹），还能根据包裹内容自动调整分拣策略，比传统的“分拣机器”（比如 Transformer）更高效、更省电！

Hunyuan-T1的核心技术特点主要体现在以下方面：

架构革新 作为全球首个基于Hybrid-Transformer-Mamba MoE架构的超大规模模型，Hunyuan-T1通过Mamba模块优化长序列处理能力。其高效计算方式在保证长文本信息捕获的同时，将解码速度提升至同类模型的2倍。
训练策略升级
- 在模型后训练阶段，96.7%的算力被投入强化学习训练，聚焦纯推理能力优化。
- 采用**课程学习（Curriculum Learning）**策略，逐步增加数据难度并扩展上下文长度，使模型在高效利用Token的同时提升推理能力。
- 结合**自奖励机制（Self-Rewarding）**与统一奖励反馈系统，通过早期T1预览版对输出结果评分，引导模型自我迭代，增强内容细节与信息密度。
数据与反馈机制 训练数据集覆盖数学、逻辑推理、科学、代码等领域，从基础问题到复杂任务层层递进。结合真实用户反馈，模型在多样化推理场景中表现出更强的鲁棒性。

Hunyuan-T1评测表现

Hunyuan-T1模型在评测中展现出鲜明的技术特点，尤其在数字推理领域表现卓越。其在MATH-500评测中以96.2分接近榜首（DeepSeek-R1的97.3分），并在AIME 2024中获得78.2分，显著优于GPT-4.5（36.7分），凸显其数学逻辑与复杂问题求解能力的优势。

下图展示了Hunyuan-T1和DeepSeek-R1等对比结果：

数据来源DataLearnerAI大模型评测基准对比工具：https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,36,40,37&modelInputString=542,492,515,495

不过，在知识问答（MMLU Pro 87.2分）和代码生成（LiveCodeBench 64.9分）任务中，Hunyuan-T1的表现没那么惊艳。同时，该模型在常识推理（GPQA Diamond 69.3分）方面稍显薄弱，低于主流模型均值。

总体而言，Hunyuan-T1的核心竞争力集中于数学推理等高精度任务，适合需要深度数值分析的场景，但在通用智能领域的均衡性仍需进一步提升。

此外，在内部人类偏好评估中，Hunyuan-T1在文本摘要、智能体任务执行等场景展现更高可靠性，幻觉率（Hallucination）显著降低。

Hunyuan-T1模型的实测结果

为了测试Hunyuan-T1模型的实际效果，我们使用一个略微复杂的买东西的例子，如下：

一个商店，牛肉30元一斤，猪肉20元一斤，茄子5元一斤，西红柿6元一斤，豆角1元一斤，每个月28日是会员日，会员每个月费用20元。购买肉类可以八折，但是最多3斤，打折从最便宜的品类开始。那么小红在3月28日购买了2.5斤牛肉和3.5斤猪肉，3斤西红柿，随后退了1斤猪肉，小红是会员，那么小红花费了多少钱

这个问题稍微有点复杂，主要在于退货的处理。经过测试，Hunyuan-T1的结果不对。模型先处理了所有费用，然后按照折扣费用退费了，退费后其实打折的肉类就不止猪肉了，但是模型没有考虑这点。不过，当我们提示退货是结账前，模型就能准确回答了（DeepSeek R1在提示结账前也能准确回答）。

HunYuan-T1不开源，但可以免费用

目前，Hunyuan-T1已通过以下渠道开放体验与部分能力接入：

在线体验：用户可通过腾讯元宝APP直接试用对话功能；
开发者资源：Hugging Face平台提供Demo测试空间，Github仓库同步公开API调用示例；

不过，该模型完全闭源，目前连上下文长度和支持的语种也不确定。关于Hunyuan-T1模型的其它信息参考我们DataLearnerAI的模型信息卡地址：https://www.datalearner.com/ai-models/pretrained-models/Hunyuan-T1

Hunyuan-T1模型概览

Hunyuan-T1技术特点与创新

Hunyuan-T1评测表现

Hunyuan-T1模型的实测结果

HunYuan-T1不开源，但可以免费用

DataLearner 官方微信