彭博社发布金融领域的ChatGPT模型——BloombergGPT
彭博社今天发布了一份研究论文,详细介绍了BloombergGPT的开发,这是一个新的大规模生成式人工智能(AI)模型。这个大型语言模型(LLM)经过专门的金融数据训练,支持金融业内的多种自然语言处理(NLP)任务。
与最近发布的模型不同,BloombergGPT是Bloomberg基于基于Hoffmann等人(2022年)和Le Scao等人(2022年)的指南进行设计。目前很少存在领域特定的LLM,这些模型仅在领域特定的数据源上进行训练,或者将一个非常大的通用模型适应于领域特定任务。而Bloomberg则是选择在领域特定和通用数据源上训练LLM。
该模型是是基于BLOOM(BLOOM是BigScience团队研发的一个大模型:https://www.datalearner.com/ai-models/pretrained-models/bloom )的仅解码器因果语言模型。
BloombergGPT目前已经收录进入DataLearner模型库中:https://www.datalearner.com/ai-models/pretrained-models/BloombergGPT
