AudioGPT
AudioGPT 是由 浙江大学 发布的 AI 模型,发布时间为 2023-04-25,定位为 基础大模型,参数规模约为 0.0B,上下文长度为 2K。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
AudioGPT是浙江大学、北京大学、CMU和中国人民大学多家研究机构联合推出的一个多模态AI系统。
尽管大模型在文本处理和生成方面取得了成功的应用,但在音频、声音等领域表现不好,主要原因:
AudioGPT是一个旨在在口语对话中优秀理解和生成音频模态的系统。具体而言,

如上图所示,AudioGPT的整个过程可以分为四个阶段:
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
