IN

InternLM-Chat 20B

InternLM-Chat 20B

发布时间: 2023-09-20374
模型参数
200.0
上下文长度
16K
中文支持
支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
16K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2023-09-20
模型文件大小
40GB
推理模式
暂无模式数据

开源和体验地址

代码开源状态
预训练权重开源
免费商用授权- 免费商用授权
在线体验
暂无在线体验地址

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。

评测得分

当前尚无可展示的评测数据。

发布机构

上海人工智能实验室
查看发布机构详情

模型解读

InternLM 20B是上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语系列大模型,200亿参数规模。在超过 2.3T Tokens 包含高质量英文、中文和代码的数据上进行预训练,其中 Chat 版本还经过了 SFT 和 RLHF 训练,使其能够更好、更安全地满足用户的需求。

InternLM 20B 在模型结构上选择了深结构,层数设定为60层,超过常规7B和13B模型所使用的32层或者40层。在参数受限的情况下,提高层数有利于提高模型的综合能力。此外,相较于InternLM-7B,InternLM-20B使用的预训练数据经过了更高质量的清洗,并补充了高知识密度和用于强化理解与推理能力的训练数据。因此,它在理解能力、推理能力、数学能力、编程能力等考验语言模型技术水平的方面都得到了显著提升。总体而言,InternLM-20B具有以下的特点:

  • 优异的综合性能
  • 很强的工具调用功能
  • 支持16k语境长度(通过推理时外推)
  • 更好的价值对齐