Vicuna 7B - Vicuna 7B

模型详细情况和参数

Vicuna 7B

模型全称
Vicuna 7B
模型简称
Vicuna 7B
模型类型
基础大模型
发布日期
2023-04-07
预训练文件大小
13.5GB
是否支持中文(中文优化)
最高支持的上下文长度
2K
模型参数数量(亿)
70.0
模型代码开源协议
Apache 2.0
预训练结果开源商用情况
开源不可商用 - 不可以商用
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
...
LLaMA
查看详情
发布机构

Vicuna 7B 简介

--------------2023年8月3日更新--------------------

Vicuna发布1.5版本更新的权重模型,效果更好:   https://huggingface.co/lmsys/vicuna-7b-v1.5 


Vicuna-7B是一个70亿规模的聊天机器人模型,基于MetaAI的LLaMA模型微调得到。

也是Vicuna家族的第2个成员,第一个是130亿参数规模的模型。


Vicuna-7B可以运行在MacBook电脑上,使用M1芯片。


Vicuna-7B模型是基于MetaAI开源的LLaMA模型微调得到,由于LLaMA模型原有协议的限制,本模型也无法商用,即使非商用使用也需要先申请LLaMA的预训练结果。


目前,Vicuna-7B的官方模型有2个版本,分别是delta-v0和delta-v1.1。前者发布于4月7日。4月12日,官方再次更新,发布1.1版本。


权重v1.1的主要更新有2个:

  • 重构标记化和分隔符。在Vicuna v1.1中,分隔符已从“###”更改为EOS令牌“</s>”。此更改使确定生成停止条件变得更加容易,并能够更好地与其他库兼容。
  • 修复有监督的微调损失计算,以获得更好的模型质量。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

Vicuna 7B所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

Vicuna 7B相关的任务
问答系统

问答系统

Question Answering

35个资源