Ziya-LLaMA-13B-Pretrain-v1
基础大模型Ziya-LLaMA-13B-Pretrain-v1
模型参数
130亿
上下文长度
4K
中文支持
支持
推理能力
Ziya-LLaMA-13B-Pretrain-v1 是由 IDEA研究院 发布的 AI 模型,发布时间为 2023-06-01,定位为 基础大模型,参数规模约为 130亿,上下文长度为 4K,模型文件大小约 26,采用 开源不可商用 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Ziya-LLaMA-13B-Pretrain-v1
模型基本信息
推理过程
不支持
思考模式
不支持思考模式
上下文长度
4K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-06-01
模型文件大小
26
MoE架构
否
总参数 / 激活参数
130亿 / 不涉及
知识截止
暂无数据
Ziya-LLaMA-13B-Pretrain-v1
开源和体验地址
代码开源状态
预训练权重开源
开源不可商用- 不可商用
在线体验
暂无在线体验地址
Ziya-LLaMA-13B-Pretrain-v1
官方介绍与博客
官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
Ziya-LLaMA-13B-Pretrain-v1
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
Ziya-LLaMA-13B-Pretrain-v1
评测结果
当前尚无可展示的评测数据。
和其他模型对比
暂时没有为该模型整理的相关对比页面。
想自定义其他组合?打开对比工具
Ziya-LLaMA-13B-Pretrain-v1
发布机构
IDEA研究院
查看发布机构详情 Ziya-LLaMA-13B-Pretrain-v1
模型解读
Ziya-LLaMA-13B-Pretrain-v1 是基于LLaMa的130亿参数大规模预训练模型,针对中文分词优化,并完成了中英文 110B tokens 的增量预训练,进一步提升了中文生成和理解能力。目前姜子牙通用大模型 Ziya-LLaMA-13B-v1 在本模型上,进一步完成了多任务有监督微调和人类反馈学习阶段的训练过程,具备翻译,编程,文本分类,信息抽取,摘要,文案生成,常识问答和数学计算等能力。
基础模型
LLaMA
查看详情DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
