InternLM 20B

Name: InternLM 20B
Author: 上海人工智能实验室

基础大模型InternLM

InternLM 20B

发布时间: 2023-09-20更新于: 2023-09-22 08:39:49.710687

在线体验GitHub Hugging Face Compare

模型参数

200亿

上下文长度

16K

中文支持

支持

推理能力

InternLM 20B 是由上海人工智能实验室发布的 AI 模型，发布时间为 2023-09-20，定位为基础大模型，参数规模约为 200亿，上下文长度为 16K，模型文件大小约 40GB，采用免费商用授权许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

InternLM 20B

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

16K tokens

最大输出长度

暂无数据

模型类型

基础大模型

输入/输出模态

暂无数据

发布时间

2023-09-20

模型文件大小

40GB

MoE架构

否

总参数 / 激活参数

200亿 / 不涉及

知识截止

暂无数据

InternLM 20B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

免费商用授权

GitHub 源码

https://github.com/InternLM/InternLM

Hugging Face

https://huggingface.co/internlm/internlm-20b

在线体验

暂无在线体验地址

InternLM 20B

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

暂无介绍博客

InternLM 20B

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

InternLM 20B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

InternLM 20B

发布机构

上海人工智能实验室

查看发布机构详情

InternLM 20B

模型解读

InternLM 20B是上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语系列大模型，200亿参数规模。在超过 2.3T Tokens 包含高质量英文、中文和代码的数据上进行预训练，其中 Chat 版本还经过了 SFT 和 RLHF 训练，使其能够更好、更安全地满足用户的需求。

InternLM 20B 在模型结构上选择了深结构，层数设定为60层，超过常规7B和13B模型所使用的32层或者40层。在参数受限的情况下，提高层数有利于提高模型的综合能力。此外，相较于InternLM-7B，InternLM-20B使用的预训练数据经过了更高质量的清洗，并补充了高知识密度和用于强化理解与推理能力的训练数据。因此，它在理解能力、推理能力、数学能力、编程能力等考验语言模型技术水平的方面都得到了显著提升。总体而言，InternLM-20B具有以下的特点：

优异的综合性能
很强的工具调用功能
支持16k语境长度（通过推理时外推）
更好的价值对齐

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送