ZI

Ziya-LLaMA-13B-Pretrain-v1

基础大模型

Ziya-LLaMA-13B-Pretrain-v1

发布时间: 2023-06-01更新于: 2023-08-15 18:16:07.675650
模型参数
130亿
上下文长度
4K
中文支持
支持
推理能力

Ziya-LLaMA-13B-Pretrain-v1 是由 IDEA研究院 发布的 AI 模型,发布时间为 2023-06-01,定位为 基础大模型,参数规模约为 130亿,上下文长度为 4K,模型文件大小约 26,采用 开源不可商用 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Ziya-LLaMA-13B-Pretrain-v1

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
4K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-06-01
模型文件大小
26
MoE架构
总参数 / 激活参数
130亿 / 不涉及
知识截止
暂无数据
Ziya-LLaMA-13B-Pretrain-v1

开源和体验地址

代码开源状态
预训练权重开源
开源不可商用- 不可商用
在线体验
暂无在线体验地址
Ziya-LLaMA-13B-Pretrain-v1

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
Ziya-LLaMA-13B-Pretrain-v1

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Ziya-LLaMA-13B-Pretrain-v1

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Ziya-LLaMA-13B-Pretrain-v1

发布机构

Ziya-LLaMA-13B-Pretrain-v1

模型解读

Ziya-LLaMA-13B-Pretrain-v1 是基于LLaMa的130亿参数大规模预训练模型,针对中文分词优化,并完成了中英文 110B tokens 的增量预训练,进一步提升了中文生成和理解能力。目前姜子牙通用大模型 Ziya-LLaMA-13B-v1 在本模型上,进一步完成了多任务有监督微调和人类反馈学习阶段的训练过程,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。

基础模型

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码