DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

腾讯发布全新推理大模型Hunyuan-T1:mamba与transformer结合的新架构,与业界模型对比评测结果不错,但是不开源

2025/03/22 11:43:19
714 阅读
Hunyuan-T1HunyuanTurboS推理大模型

2025年3月21日,腾讯正式推出其全新大模型Hunyuan-T1,该模型基于此前发布的TurboS快速思维基座,首次采用Hybrid-Transformer-Mamba混合专家架构(MoE),在推理效率、长文本处理及资源消耗优化等方面表现还不错。此外,这个新架构也使得Hunyuan-T1速度非常快,模型支持首字符1秒内响应,生成速度达60-80 token/秒,适用于实时交互场景。

腾讯发布Hunyuan-T1大模型介绍
腾讯发布Hunyuan-T1大模型介绍
  • **Hunyuan-T1模型概览**
  • **Hunyuan-T1技术特点与创新**
  • **Hunyuan-T1评测表现**
  • **Hunyuan-T1模型的实测结果**
  • **HunYuan-T1不开源,但可以免费用**

Hunyuan-T1模型概览

Hunyuan-T1是腾讯混元大模型系列中首个面向深度推理场景的官方版本,其前身为2025年2月发布的Hunyuan-T1预览版(Hunyuan-Thinker-1-Preview)。此次升级后,模型通过大规模后训练(Post-training)进一步强化了纯推理能力,并提升了对人类偏好的对齐水平。

在2025年3月10日,腾讯曾经发布过Hunyuan-TurboS模型(参考此前DataLearnerAI的Hunyuan-TurboS的介绍:Hunyuan-TurboS模型信息卡,也是一个非常不错的非推理版本的大模型,本次发布的Hunyuan-T1的基座就是Hunyuan-TurboS模型。

Hunyuan TurboS结合了Transformer与Mamba架构的优势,解决了长文本推理中的上下文丢失和长距离信息依赖问题,同时显著降低计算资源消耗。

Hunyuan-T1技术特点与创新

Hunyuan-T1的核心创新点是架构,它是transformer与mamba结合的大模型架构。Mamba 是一种新型的大语言模型架构,由 Albert Gu 和 Tri Dao 等研究者在 2023 年提出。它基于状态空间模型(State Space Models, SSMs),旨在解决传统 Transformer 架构在处理长序列时存在的计算复杂度和内存占用问题,同时通过**选择性机制(Selective Mechanism)**提升模型对上下文的理解能力。

简单来说就是Mamba 就像一个“聪明的快递分拣员”,能快速处理超长的包裹流水线(比如 100 万个包裹),还能根据包裹内容自动调整分拣策略,比传统的“分拣机器”(比如 Transformer)更高效、更省电!

Hunyuan-T1的核心技术特点主要体现在以下方面:

  1. 架构革新
    作为全球首个基于Hybrid-Transformer-Mamba MoE架构的超大规模模型,Hunyuan-T1通过Mamba模块优化长序列处理能力。其高效计算方式在保证长文本信息捕获的同时,将解码速度提升至同类模型的2倍。

  2. 训练策略升级

    • 在模型后训练阶段,96.7%的算力被投入强化学习训练,聚焦纯推理能力优化。
    • 采用**课程学习(Curriculum Learning)**策略,逐步增加数据难度并扩展上下文长度,使模型在高效利用Token的同时提升推理能力。
    • 结合**自奖励机制(Self-Rewarding)**与统一奖励反馈系统,通过早期T1预览版对输出结果评分,引导模型自我迭代,增强内容细节与信息密度。
  3. 数据与反馈机制
    训练数据集覆盖数学、逻辑推理、科学、代码等领域,从基础问题到复杂任务层层递进。结合真实用户反馈,模型在多样化推理场景中表现出更强的鲁棒性。

Hunyuan-T1评测表现

Hunyuan-T1模型在评测中展现出鲜明的技术特点,尤其在数字推理领域表现卓越。其在MATH-500评测中以96.2分接近榜首(DeepSeek-R1的97.3分),并在AIME 2024中获得78.2分,显著优于GPT-4.5(36.7分),凸显其数学逻辑与复杂问题求解能力的优势。

下图展示了Hunyuan-T1和DeepSeek-R1等对比结果:

数据来源DataLearnerAI大模型评测基准对比工具:https://www.datalearner.com/ai-models/ai-benchmarks-tests/compare-result?benchmarkInputString=16,32,36,40,37&modelInputString=542,492,515,495

不过,在知识问答(MMLU Pro 87.2分)和代码生成(LiveCodeBench 64.9分)任务中,Hunyuan-T1的表现没那么惊艳。同时,该模型在常识推理(GPQA Diamond 69.3分)方面稍显薄弱,低于主流模型均值。

总体而言,Hunyuan-T1的核心竞争力集中于数学推理等高精度任务,适合需要深度数值分析的场景,但在通用智能领域的均衡性仍需进一步提升。

此外,在内部人类偏好评估中,Hunyuan-T1在文本摘要、智能体任务执行等场景展现更高可靠性,幻觉率(Hallucination)显著降低。

Hunyuan-T1模型的实测结果

为了测试Hunyuan-T1模型的实际效果,我们使用一个略微复杂的买东西的例子,如下:

一个商店,牛肉30元一斤,猪肉20元一斤,茄子5元一斤,西红柿6元一斤,豆角1元一斤,每个月28日是会员日,会员每个月费用20元。购买肉类可以八折,但是最多3斤,打折从最便宜的品类开始。那么小红在3月28日购买了2.5斤牛肉和3.5斤猪肉,3斤西红柿,随后退了1斤猪肉,小红是会员,那么小红花费了多少钱

这个问题稍微有点复杂,主要在于退货的处理。经过测试,Hunyuan-T1的结果不对。模型先处理了所有费用,然后按照折扣费用退费了,退费后其实打折的肉类就不止猪肉了,但是模型没有考虑这点。不过,当我们提示退货是结账前,模型就能准确回答了(DeepSeek R1在提示结账前也能准确回答)。

HunYuan-T1不开源,但可以免费用

目前,Hunyuan-T1已通过以下渠道开放体验与部分能力接入:

  • 在线体验:用户可通过腾讯元宝APP直接试用对话功能;
  • 开发者资源:Hugging Face平台提供Demo测试空间,Github仓库同步公开API调用示例;

不过,该模型完全闭源,目前连上下文长度和支持的语种也不确定。关于Hunyuan-T1模型的其它信息参考我们DataLearnerAI的模型信息卡地址:https://www.datalearner.com/ai-models/pretrained-models/Hunyuan-T1

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • 腾讯发布了一个全新的大模型Hunyuan Turbo S:号称评测效果超过GTP-4o和DeepSeek V3等模型,但没有开源或者放开使用
  • 你的MiniMax M2模型效果为什么不好?可能是用错了,官方建议正确使用Interleaved Thinking,模型效果最多可提升35%的效果
  • 法国人工智能初创企业MistralAI发布首个推理模型Magistral:纯RL训练,多语言能力出色,推理速度很快,Magistral Small (24B)版本免费开源,但面对Qwen3和DeepSeek稍显乏力
  • OpenAI发布最强大模型OpenAI o3-pro:业界评价该模型解决复杂问题效果很好,但是回复一句“Hi”也需要三分钟
  • DeepSeekAI发布DeepSeek-R1-0528更新版本,官方宣称小幅增强,评测结果提升较大,幻觉降低,json输出增强
  • 微软开源140亿参数规模的Phi-4推理版本大模型:多项评测结果超过OpenAI o1-mini,单张4090可运行,完全免费开源
  • 百度在周末发布了2个新一代文心一言大模型,分别是没有推理能力的ERNIE 4.5以及有推理能力的ERNIE X1,即日起可以免费使用
  • 重磅!阿里开源325亿参数规模的推理大模型QwQ-32B:性能接近DeepSeek R1满血版,参数更低,免费商用授权!

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署