Vicuna 7B

Name: Vicuna 7B
Author: LM-SYS

基础大模型Vicuna

Vicuna 7B

发布时间: 2023-04-07更新于: 2023-08-03 14:11:49.431885

在线体验GitHub Hugging Face Compare

模型参数

70亿

上下文长度

中文支持

不支持

推理能力

Vicuna 7B 是由 LM-SYS 发布的 AI 模型，发布时间为 2023-04-07，定位为基础大模型，参数规模约为 70亿，上下文长度为 2K，模型文件大小约 13.5GB，采用开源不可商用许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Vicuna 7B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

2K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-04-07

模型文件大小

13.5GB

MoE架构

否

总参数 / 激活参数

70亿 / 不涉及

知识截止

暂无数据

Vicuna 7B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

开源不可商用- 不可商用

GitHub 源码

https://github.com/lm-sys/FastChat

Hugging Face

https://huggingface.co/lmsys/vicuna-7b-delta-v0

在线体验

暂无在线体验地址

Vicuna 7B

官方介绍与博客

官方论文

Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality

DataLearnerAI博客

暂无介绍博客

Vicuna 7B

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Vicuna 7B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Vicuna 7B

发布机构

LM-SYS

查看发布机构详情

Vicuna 7B

模型解读

--------------2023年8月3日更新--------------------

Vicuna发布1.5版本更新的权重模型，效果更好： https://huggingface.co/lmsys/vicuna-7b-v1.5

Vicuna-7B是一个70亿规模的聊天机器人模型，基于MetaAI的LLaMA模型微调得到。

也是Vicuna家族的第2个成员，第一个是130亿参数规模的模型。

Vicuna-7B可以运行在MacBook电脑上，使用M1芯片。

Vicuna-7B模型是基于MetaAI开源的LLaMA模型微调得到，由于LLaMA模型原有协议的限制，本模型也无法商用，即使非商用使用也需要先申请LLaMA的预训练结果。

目前，Vicuna-7B的官方模型有2个版本，分别是delta-v0和delta-v1.1。前者发布于4月7日。4月12日，官方再次更新，发布1.1版本。

权重v1.1的主要更新有2个：

重构标记化和分隔符。在Vicuna v1.1中，分隔符已从“###”更改为EOS令牌“</s>”。此更改使确定生成停止条件变得更加容易，并能够更好地与其他库兼容。
修复有监督的微调损失计算，以获得更好的模型质量。

基础模型

LLaMA

查看详情

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送