IN

InternLM 20B

基础大模型InternLM

InternLM 20B

发布时间: 2023-09-20更新于: 2023-09-22 08:39:49.710687
模型参数
200亿
上下文长度
16K
中文支持
支持
推理能力

InternLM 20B 是由 上海人工智能实验室 发布的 AI 模型,发布时间为 2023-09-20,定位为 基础大模型,参数规模约为 200亿,上下文长度为 16K,模型文件大小约 40GB,采用 免费商用授权 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

InternLM 20B

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
16K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2023-09-20
模型文件大小
40GB
MoE架构
总参数 / 激活参数
200亿 / 不涉及
知识截止
暂无数据
InternLM 20B

开源和体验地址

代码开源状态
预训练权重开源
免费商用授权
在线体验
暂无在线体验地址
InternLM 20B

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
暂无介绍博客
InternLM 20B

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
InternLM 20B

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

InternLM 20B

发布机构

上海人工智能实验室
上海人工智能实验室
查看发布机构详情
InternLM 20B

模型解读

InternLM 20B是上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语系列大模型,200亿参数规模。在超过 2.3T Tokens 包含高质量英文、中文和代码的数据上进行预训练,其中 Chat 版本还经过了 SFT 和 RLHF 训练,使其能够更好、更安全地满足用户的需求。

InternLM 20B 在模型结构上选择了深结构,层数设定为60层,超过常规7B和13B模型所使用的32层或者40层。在参数受限的情况下,提高层数有利于提高模型的综合能力。此外,相较于InternLM-7B,InternLM-20B使用的预训练数据经过了更高质量的清洗,并补充了高知识密度和用于强化理解与推理能力的训练数据。因此,它在理解能力、推理能力、数学能力、编程能力等考验语言模型技术水平的方面都得到了显著提升。总体而言,InternLM-20B具有以下的特点:

  • 优异的综合性能
  • 很强的工具调用功能
  • 支持16k语境长度(通过推理时外推)
  • 更好的价值对齐

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码