BA

Baichuan 13B - Base

基础大模型

Baichuan 13B - Base

发布时间: 2023-07-08更新于: 2023-08-16 20:56:30.748589

在线体验GitHub Hugging Face Compare

模型参数

130亿

上下文长度

4K

中文支持

支持

推理能力

Baichuan 13B - Base 是由百川智能发布的 AI 模型，发布时间为 2023-07-08，定位为基础大模型，参数规模约为 130.0B，上下文长度为 4K，模型文件大小约 26.6GB，采用免费商用授权许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Baichuan 13B - Base

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

4K tokens

最大输出长度

暂无数据

模型类型

基础大模型

发布时间

2023-07-08

模型文件大小

26.6GB

MoE架构

否

总参数 / 激活参数

130 亿 / 不涉及

知识截止

暂无数据

Baichuan 13B - Base

开源和体验地址

代码开源状态

预训练权重开源

免费商用授权- 免费商用授权

GitHub 源码

https://github.com/baichuan-inc/Baichuan-13B

Hugging Face

https://huggingface.co/baichuan-inc/Baichuan-13B-Base

在线体验

暂无在线体验地址

Baichuan 13B - Base

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

Baichuan 13B - Base

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Baichuan 13B - Base

评测结果

当前尚无可展示的评测数据。

Baichuan 13B - Base

发布机构

百川智能

查看发布机构详情

Baichuan 13B - Base

模型解读

Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型，在权威的中文和英文 benchmark 上均取得同尺寸最好的效果。本次发布包含有预训练 (Baichuan-13B-Base) 和对齐 (Baichuan-13B-Chat) 两个版本。Baichuan-13B 有如下几个特点：

更大尺寸、更多数据：Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿，并且在高质量的语料上训练了 1.4 万亿 tokens，超过 LLaMA-13B 40%，是当前开源 13B 尺寸下训练数据量最多的模型。支持中英双语，使用 ALiBi 位置编码，上下文窗口长度为 4096。
同时开源预训练和对齐模型：预训练模型是适用开发者的『基座』，而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型（Baichuan-13B-Chat），具有很强的对话能力，开箱即用，几行代码即可简单的部署。
更高效的推理：为了支持更广大用户的使用，我们本次同时开源了 int8 和 int4 的量化版本，相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛，可以部署在如 Nvidia 3090 这样的消费级显卡上。
开源免费可商用：Baichuan-13B 不仅对学术研究完全开放，开发者也仅需邮件申请并获得官方商用许可后，即可以免费商用。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码