DeepSeekMoE 145B Base - DeepSeekMoE 145B Base

模型详细情况和参数

DeepSeekMoE 145B Base

模型全称
DeepSeekMoE 145B Base
模型简称
DeepSeekMoE 145B Base
模型类型
基础大模型
发布日期
2024-01-11
预训练文件大小
288GB
是否支持中文(中文优化)
最高支持的上下文长度
4K
模型参数数量(亿)
1446.0
模型代码开源协议
MIT License
预训练结果开源商用情况
DEEPSEEK LICENSE AGREEMENT - 免费商用授权
模型HuggingFace链接
暂无
在线演示地址
暂无
DataLearnerAI的模型介绍
基础模型
无基础模型
发布机构

DeepSeekMoE 145B Base 简介

DeepSeekMoE是幻方量化旗下大模型企业DeepSeek开源的一个混合专家大模型,也是目前已知的中国第一个开源的MoE大模型。

DeepSeekMoE 145B Base是其1446亿参数的版本。

欢迎大家关注DataLearner官方微信,接受最新的AI模型和技术推送

DeepSeekMoE 145B Base所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

DeepSeekMoE 145B Base相关的任务
问答系统

问答系统

Question Answering

35个资源