国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布开源可商用大语言模型CPM-Bee

5月27日，OpenBMB发布了一个最高有100亿参数规模的开源大语言模型CPM-BEE，OpenBMB是清华大学NLP实验室联合智源研究院成立的一个开源组织。该模型针对高质量中文数据集做了训练优化，支持中英文。根据官方的测试结果，其英文测试水平约等于LLaMA-13B，中文评测结果优秀。

此前，国产开源大语言模型最强的应该是ChatGLM-6B（https://www.datalearner.com/ai-models/pretrained-models/ChatGLM-6B ），这也是清华大学研究成果，是清华大学KEG小组发布的，在国内外都有很好的反响，截止5月26日，ChatGLM-6B 全球下载达到200万。相比较ChatGLM-6B，CPM-Bee的主要特点如下：

CPM-Bee模型参数	CPM-Bee模型参数结果
模型名称	CPM-Bee
模型架构	transformer
基础模型	CPM-Ant
模型最大参数	100亿
训练时间	2022年10月13日-2023年3月29日
模型类型	基础语言模型
训练数据集	200GB高质量中文数据集+400GB多语言数据集
训练数据集tokens数	1万亿

CPM-Bee模型版本	推理的显存	推荐的硬件
CPM-Bee-10B	20GB	RTX3090（24GB）
CPM-Bee-5B	11 GB	RTX 3090（24 GB）
CPM-Bee-2B	6.7 GB	GTX 1080（8 GB）
CPM-Bee-1B	4.1 GB	GTX 1660（6 GB）

模型	Average	BoolQ	PIQA	SIQA	HellaSwag	WinoGrande	ARC-e	ARC-c	OBQA
GPT-3		60.5	81	-	78.9	70.2	68.8	51.4	57.6
Gopher		79.3	81.8	50.6	79.2	70.1	-	-	-

国产开源中文大语言模型再添重磅玩家：清华大学NLP实验室发布开源可商用大语言模型CPM-Bee

DataLearner WeChat

CPM-Bee简介

CPM-Bee的效果

CPM-Bee的开源协议

Hot Blogs