PA

PanGu-Coder2

编程大模型

PanGu-Coder2

发布时间: 2023-07-27更新于: 2023-07-28 21:35:42.792615
在线体验GitHubHugging FaceCompare
模型参数
150亿
上下文长度
8K
中文支持
支持
推理能力

PanGu-Coder2 是由 华为 发布的 AI 模型,发布时间为 2023-07-27,定位为 编程大模型,参数规模约为 150亿,上下文长度为 8K,模型文件大小约 0GB,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

PanGu-Coder2

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
8K tokens
最大输出长度
暂无数据
模型类型
编程大模型
输入/输出模态
暂无数据
发布时间
2023-07-27
模型文件大小
0GB
MoE架构
总参数 / 激活参数
150亿 / 不涉及
知识截止
暂无数据
PanGu-Coder2

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
PanGu-Coder2

官方介绍与博客

PanGu-Coder2

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
PanGu-Coder2

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

PanGu-Coder2

发布机构

PanGu-Coder2

模型解读

PanGu-Coder2 是一种大型语言模型,专门用于代码生成。它基于一种被称为 RRTF (RankResponses to align Test&Teacher Feedback) 的新框架,该框架结合了多种先进技术,包括指令调整、Evol-Instruct 方法和强化学习。RRTF 的核心思想是通过使用测试信号和人类偏好作为反馈来对响应进行排名,从而引导模型生成更高质量的代码。

在模型架构方面,PanGu-Coder2 是一个基于解码器的 Transformer,具有 Multi-Query-Attention 和学习的绝对位置嵌入。同时,它使用了 FlashAttention 来减少计算和内存使用量,因此模型的最大长度可以扩展到 8192。模型的详细超参数如下:

  • 隐藏层大小:6144
  • 最大长度:8192
  • 注意力头的数量:48
  • Transformer 隐藏层的数量:40

在训练过程中,PanGu-Coder2 使用了 Evol-Instruct 技术来构建训练语料库,这种技术可以通过深度演化来迭代地从 Alpaca 20K 数据集中获取新的编程问题。通过这些问题,模型可以从不同的模型中采样答案。总的来说,他们收集了一个包含 100K 编程问题及其答案的初始语料库,这些问题和答案被称为指令和解决方案对。此外,他们还对初始语料库进行了数据预处理,并将语料库的大小减少到了 68K。

在训练过程中,PanGu-Coder2 使用了 RRTF 框架,该框架可以根据人类的偏好对来自不同来源的响应进行排名,并通过排名损失函数对模型进行调整。与 RLHF 相比,RRTF 可以有效地将语言模型的输出概率与人类的偏好对齐,只需要在调整期间使用 1-2 个模型,而且在实现、超参数调整和训练方面比 PPO 更简单。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码