CH

ChatGLM2-6B

聊天大模型ChatGLMChatGLM2

Chat General Language Model 2 - 6B

发布时间: 2023-06-25更新于: 2023-08-25 17:05:28.077706
模型参数
62亿
上下文长度
32K
中文支持
支持
推理能力

Chat General Language Model 2 - 6B 是由 智谱AI 发布的 AI 模型,发布时间为 2023-06-25,定位为 聊天大模型,参数规模约为 62亿,上下文长度为 32K,模型文件大小约 12GB,采用 ChatGLM2-6B Model License 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

ChatGLM2-6B

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
32K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
输入/输出模态
暂无数据
发布时间
2023-06-25
模型文件大小
12GB
MoE架构
总参数 / 激活参数
62亿 / 不涉及
知识截止
暂无数据
ChatGLM2-6B

开源和体验地址

代码开源状态
预训练权重开源
ChatGLM2-6B Model License- 免费商用授权
在线体验
暂无在线体验地址
ChatGLM2-6B

官方介绍与博客

ChatGLM2-6B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
ChatGLM2-6B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

ChatGLM2-6B

发布机构

Chat General Language Model 2 - 6B

模型解读

关于ChatGLM2-6B的详细介绍可以参考: https://www.datalearner.com/blog/1051687694704581 


ChatGLM2-6B是清华大学知识工程和数据挖掘小组(Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University)发布的ChatGLM-6B模型的第二代。于2023年6月25日发布。


相比较第一代的ChatGLM-6B,ChatGLM2-6B模型的性能更加强大,并支持更长的上下文。


ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度。生成 2000 个字符的平均速度对比如下

Model推理速度 (字符/秒)
ChatGLM-6B31.49
ChatGLM2-6B44.62


ChatGLM2-6B的推理显存需求:

量化等级编码 2048 长度的最小显存生成 8192 长度的最小显存
FP16 / BF1613.1 GB12.8 GB
INT88.2 GB8.1 GB
INT45.5 GB5.1 GB


ChatGLM2-6B模型的预训练文件下载地址

HuggingFace地址: https://huggingface.co/THUDM/chatglm2-6b/tree/main 

清华大学云盘地址: https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/ 


注意,所有的bin文件都要下载,而且config.json也要下载,这个文件只能在HuggingFace上下载,缺少这个文件会报配置错误。

基础模型

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码