加载中...
加载中...
Tencent HunyuanImage-3.0-Instruct
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0 | -- |
| 图片 | 0 | 0 |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 0 | -- |
| 图片 | 0 | 0 |
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 0 | -- |
| 图片 | 0 | 0 |
HunyuanImage-3.0-Instruct 是腾讯混元(Tencent Hunyuan)团队于 2026 年 1 月正式开源的旗舰级图像生成与编辑模型。作为 HunyuanImage 3.0 系列的核心成员,它专为高难度的指令遵循(Instruction Following)和图像编辑任务设计。该模型采用了先进的 MoE(Mixture of Experts) 架构,是目前业界规模最大的开源图像生成模型之一。其核心目标是解决复杂自然语言指令下的精确图像编辑、多图融合及长文本理解问题,通过引入原生的思维链(Chain-of-Thought, CoT)机制,显著提升了模型对用户意图的推理与执行能力。
根据官方及社区的初步评测,HunyuanImage-3.0-Instruct 在图像编辑准确性、多图融合的一致性以及长文本生成的语义对齐上,表现达到了开源领域的 SOTA(State-of-the-Art)水平,在 LMArena 等基准测试的图像编辑榜单中名列前茅,综合能力足以对标顶尖的闭源商业模型(如 Midjourney v6 等)。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
