Baichuan2-7B-Chat（Baichuan2-7B-Chat）详细信息 | 名称、简介、使用方法，开源情况，商用授权信息 | DataLearnerAI

BA

Baichuan2-7B-Chat

Baichuan2-7B-Chat

发布时间: 2023-09-06更新于: 2023-09-09 10:23:49.786555

在线体验GitHub Hugging Face

模型参数

70.0亿

上下文长度

4K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

模型基本信息

推理过程

不支持

上下文长度

4K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

发布时间

2023-09-06

模型文件大小

开源和体验地址

代码开源状态

预训练权重开源

Baichuan 2模型社区许可协议- 免费商用授权

GitHub 源码

https://github.com/baichuan-inc/Baichuan2

Hugging Face

https://huggingface.co/baichuan-inc/Baichuan2-7B-Chat

在线体验

官方介绍与博客

官方论文

Baichuan 2: Open Large-scale Language Models

DataLearnerAI博客

暂无介绍博客

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

评测得分

当前尚无可展示的评测数据。

发布机构

百川智能

查看发布机构详情

模型解读

Baichuan2-7B-Chat是百川公司开源的百川系列大模型的第二代。这是第二代模型中针对对话进行调优和对齐的版本。相比较第一代的模型，第二代的Baichuan2-7B-Chat在各方面都有较大的提升。

Baichuan2系列包含3类：基础模型、微调（对齐）模型和量化版本的模型。其中Baichuan2-7B-Base是基础模型，70亿参数。

第二代的大模型在2.6万亿Tokens的高质量语料上训练，比第一代使用了更多的语料。

Baichuan2-7B-Chat的推理显存需要15.3GB才能完成。具体Baichuan2-7B的推理显存（包括量化版本）参考如下：

量化精度	Baichuan2-7B
bf16 / fp16	15.3
8bits	8.0
4bits	5.1

第二代百川大模型还有13B的版本，需要更高的显存，但是表现更好，Baichuan2-13B系列所需的推理显存参考 Baichuan2-13B-Chat的DataLearner模型信息卡。

相比较第一代的 Baichuan 7B ，第二代模型在文本理解、推理能力、数学方面都有较大的提升。并且也是免费商用授权，但需要获得授权许可~

Baichuan2-7B-Chat模型在MMLU、C-Eval、AGIEval和GSM8K上的表现参考DataLearner大模型评测综合排行： https://www.datalearner.com/ai-models/llm-evaluation

Baichuan2系列模型的详细介绍，包括训练细节、数据集等参考DataLearner官方描述： https://www.datalearner.com/blog/1051694226173083

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码