DE

DeepSeek LLM 7B Base

基础大模型DeepSeek LLMDeepSeek LLM

DeepSeek LLM 7B Base

发布时间: 2023-11-29更新于: 2024-01-11 13:15:01.270740

在线体验GitHub Hugging Face Compare

模型参数

70亿

上下文长度

4K

中文支持

支持

推理能力

DeepSeek LLM 7B Base 是由 DeepSeek-AI 发布的 AI 模型，发布时间为 2023-11-29，定位为基础大模型，参数规模约为 70亿，上下文长度为 4K，模型文件大小约 13.82GB，采用 DEEPSEEK LICENSE AGREEMENT 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

DeepSeek LLM 7B Base

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

4K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-11-29

模型文件大小

13.82GB

MoE架构

否

总参数 / 激活参数

70亿 / 不涉及

知识截止

暂无数据

DeepSeek LLM 7B Base

开源和体验地址

代码开源状态

预训练权重开源

DEEPSEEK LICENSE AGREEMENT- 免费商用授权

GitHub 源码

https://github.com/deepseek-ai/DeepSeek-LLM

Hugging Face

https://huggingface.co/deepseek-ai/deepseek-llm-7b-base

在线体验

暂无在线体验地址

DeepSeek LLM 7B Base

官方介绍与博客

官方论文

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

DataLearnerAI博客

暂无介绍博客

DeepSeek LLM 7B Base

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

DeepSeek LLM 7B Base

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

DeepSeek LLM 7B Base

发布机构

DeepSeek-AI

查看发布机构详情

DeepSeek LLM 7B Base

模型解读

DeepSeek LLM 7B Base是DeepSeekAI开源的一个大语言模型。DeepSeekAI是中国知名私募幻方量化旗下的一个人工智能大模型企业。

DeepSeek LLM 7B Base是他们开源的一个70亿参数版本的大语言模型，其效果与LLaMA2-7B差不多。但是中文任务评测结果明显好于LLaMA2-7B。DeepSeek LLM模型本身包含了四个版本，2个参数规模等级，分别是7B和67B，而模型本身区分Base版本的基座模型和对话调优的Chat版本。

DeepSeek LLM 7B Base这里说的是70亿参数的基座版本。DeepSeekLLM四个版本的评测数据如下：

Model	TriviaQA	MMLU	GSM8K	HumanEval	BBH	C-Eval	CMMLU	ChineseQA
DeepSeek LLM 7B Base	59.7	48.2	17.4	26.2	39.5	45.0	47.2	78.0
DeepSeek LLM 67B Base	78.9	71.3	63.4	42.7	68.7	66.1	70.8	87.6
DeepSeek LLM 7B Chat	57.9	49.4	62.6	48.2	42.3	47.0	49.7	75.0
DeepSeek LLM 67B Chat	81.5	71.1	84.1	73.8	71.7	65.2	67.8	85.1

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码