关于ChatGLM2-6B的详细介绍可以参考： https://www.datalearner.com/blog/1051687694704581

ChatGLM2-6B是清华大学知识工程和数据挖掘小组（Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University）发布的ChatGLM-6B模型的第二代。于2023年6月25日发布。

相比较第一代的ChatGLM-6B，ChatGLM2-6B模型的性能更加强大，并支持更长的上下文。

ChatGLM2-6B 使用了 Multi-Query Attention，提高了生成速度。生成 2000 个字符的平均速度对比如下

Model	推理速度 (字符/秒)
ChatGLM-6B	31.49
ChatGLM2-6B	44.62

ChatGLM2-6B的推理显存需求：

量化等级	编码 2048 长度的最小显存	生成 8192 长度的最小显存
FP16 / BF16	13.1 GB	12.8 GB
INT8	8.2 GB	8.1 GB
INT4	5.5 GB	5.1 GB

ChatGLM2-6B模型的预训练文件下载地址

HuggingFace地址： https://huggingface.co/THUDM/chatglm2-6b/tree/main

清华大学云盘地址： https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/

注意，所有的bin文件都要下载，而且config.json也要下载，这个文件只能在HuggingFace上下载，缺少这个文件会报配置错误。

ChatGLM2-6B

模型基本信息

是否支持推理过程

最高上下文输入长度

最长输出结果

模型类型

发布时间

模型预文件大小

开源和体验地址

代码开源状态

预训练权重开源

GitHub 源码

Hugging Face

在线体验

官方介绍与博客

官方论文

DataLearnerAI博客

API接口信息

接口速度（满分5分）

接口价格

输入价格:

输出价格:

输入支持的模态

文本

图片

视频

音频

Embedding（向量）

输出支持的模态

文本

图片

视频

音频

Embedding（向量）

ChatGLM2-6B模型在各大评测榜单的评分

发布机构

模型介绍

关于ChatGLM2-6B的详细介绍可以参考： https://www.datalearner.com/blog/1051687694704581

ChatGLM2-6B模型的预训练文件下载地址

Foundation Model

GLM

关注DataLearnerAI公众号