DeciLM 6B-Instruct
DeciLM 6B-Instruct
模型参数
57.0亿
上下文长度
4K
中文支持
不支持
推理能力
模型基本信息
推理过程
不支持
上下文长度
4K tokens
最大输出长度
暂无数据
模型类型
基础大模型
发布时间
2023-09-13
模型文件大小
11.3GB
MoE架构
否
总参数 / 激活参数
57.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据
开源和体验地址
预训练权重开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
在线体验
暂无在线体验地址
官方介绍与博客
DataLearnerAI博客
暂无介绍博客
API接口信息
接口速度
暂无数据
暂无公开的 API 定价信息。
评测得分
当前尚无可展示的评测数据。
发布机构
Deci
查看发布机构详情 模型解读
DeciLM 6B-Instruct是一种专为短文本指令跟随任务设计的语言模型。以下是其关键信息的总结:
- 开发者:DeciLM 6B-Instruct是由Deci开发的,Deci是一家专注于人工智能和深度学习技术的公司。
- 模型类型:它基于DeciLM 6B架构,这是一种自回归语言模型。这意味着它逐个标记地生成文本,并可用于各种自然语言处理(NLP)任务。DeciLM 6B-Instruct采用了优化的变换器解码器架构,其中包括可变的Grouped-Query Attention,这可能会增强其在特定任务上的性能。
- 语言支持:此模型主要支持英语,适用于需要英语NLP功能的任务和应用。
- 许可证:DeciLM 6B-Instruct根据"Llama 2社区许可协议"提供,由Deci提供有关托管服务提供商的扩展。这表明它可以在特定环境中使用,并可能有使用限制。
- 模型来源:您可以通过提供的来源访问与DeciLM 6B-Instruct相关的更多信息和资源,例如技术细节和演示:技术博客:DeciLM 6B技术博客演示:DeciLM 6B-Instruct演示笔记本:DeciLM 6B笔记本
- 用途:该模型旨在用于商业和研究目的。它专为英语设计,可以进行微调以在其他语言的应用中使用。其主要关注点是短文本指令跟随,表明它在处理和生成英语中简洁指令的任务中具有用途。
总之,DeciLM 6B-Instruct是一种专为指令型NLP任务定制的语言模型,主要支持英语,并可在各种商业和研究环境中应用,在其他语言中进行微调的潜力也很大。它由Deci开发,并附带特定的许可条款。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
