截止目前中文领域最大参数量的大模型开源:上海人工智能实验室开源200亿参数的书生·浦语大模型(InternLM 20B系列),性能提升非常明显!
上海人工智能实验室是国内顶尖的人工智能实验室,此前在大模型领域,他们与商汤科技发布的书生·浦语系列在国内引起了很大的关注。此次,他们又开源了一个全新的200亿参数规模的大语言模型InternLM 20B,应该是截止目前中文领域开源的参数规模最大的一个大模型了。

InternLM系列
InternLM的中文是书生·浦语,这个系列的大语言模型是上海人工智能实验室与商汤科技一起训练的系列模型。在2023年6月份,他们开源了70亿参数的2个版本的模型,由于开源协议十分友好,且评测结果文档较为完善,吸引了很多人的关注。
InternLM 7B系列在上万亿tokens数据集上使用几千张GPU训练支持8K上下文长度,并在后续的更新中微调增加了代码解释和函数调用的能力。
三个月之后的9月份,他们再次开源InternLM 20B系列的2个模型,参数规模200亿。
InternLM 20B系列介绍
InternLM 20B目前包含2个版本的模型,一个是基础大模型InternLM 20B(DataLeanrer模型地址:https://www.datalearner.com/ai-models/pretrained-models/InternLM-20B ),一个是针对聊天优化的InternLM Chat 20B(https://www.datalearner.com/ai-models/pretrained-models/InternLM-Chat-20B )。


