Qwen3-TTS-12Hz-1.7B-VoiceDesign-2B
Qwen3-TTS-12Hz-1.7B-VoiceDesign-2B 是由 阿里巴巴 发布的 AI 模型,发布时间为 2026-01-22,定位为 语音大模型,参数规模约为 0.0B,采用 Qwen License 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Qwen3-TTS-12Hz-1.7B-VoiceDesign 2B 为 Qwen3-TTS 系列中面向声音设计(Voice Design)与情感/音色控制增强的变体,支持控制性更强的音色参数输入以生成目标风格语音。
该模型同样兼顾多语言与多音色生成,具体参数披露尚未完整公开。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
