DeepSeek-AI 简介

DeepSeek-AI

DeepSeek是幻方量化旗下的一家大模型企业。幻方量化是中国知名的私募巨头,根据此前的信息,幻方量化有1万多张A100显卡,在美国显卡禁令之前用于量化投资。

DeepSeek成立与2023年7月份,致力于探索人工智能本质。他们发布了多个开源大语言模型,包括DeepSeek LLM、DeepSeek Coder等多个模型,在多项评测中都有非常好的表现。


DeepSeek的GitHub开源地址: https://github.com/deepseek-ai 

DeepSeek官方的大模型地址: https://chat.deepseek.com/ 

DeepSeek-AI发布的大模型列表

DeepSeek Coder-33B Instruct

330.0

亿个参数

2023-11-01

发布时间

免费商用授权

预训练结果开源

DeepSeek Coder-6.7B Instruct

67.0

亿个参数

2023-11-01

发布时间

免费商用授权

预训练结果开源

DeepSeek LLM 7B Base

70.0

亿个参数

2023-11-29

发布时间

免费商用授权

预训练结果开源

DeepSeek LLM 7B Chat

70.0

亿个参数

2023-11-29

发布时间

免费商用授权

预训练结果开源

DeepSeek LLM 67B Chat

670.0

亿个参数

2023-11-29

发布时间

免费商用授权

预训练结果开源

DeepSeek LLM 67B Base

670.0

亿个参数

2023-11-29

发布时间

免费商用授权

预训练结果开源

DeepSeekMoE 16B Base

164.0

亿个参数

2024-01-11

发布时间

免费商用授权

预训练结果开源

DeepSeekMoE 145B Base

1446.0

亿个参数

2024-01-11

发布时间

免费商用授权

预训练结果开源

DeepSeekMoE 145B Chat

1446.0

亿个参数

2024-01-11

发布时间

免费商用授权

预训练结果开源

DeepSeek VL-7B-Chat

70.0

亿个参数

2024-03-11

发布时间

免费商用授权

预训练结果开源

DeepSeek VL-7B-Base

70.0

亿个参数

2024-03-11

发布时间

免费商用授权

预训练结果开源

DeepSeek VL-1.3B-Base

13.0

亿个参数

2024-03-11

发布时间

免费商用授权

预训练结果开源

DeepSeek VL-1.3B-Chat

13.0

亿个参数

2024-03-11

发布时间

免费商用授权

预训练结果开源