PA

PaLM

基础大模型PaLM

Pathways Language Model

发布时间: 2022-04-05更新于: 2023-08-16 22:04:56.850798
在线体验GitHubHugging FaceCompare
模型参数
5400亿
上下文长度
2K
中文支持
不支持
推理能力

Pathways Language Model 是由 Google Research 发布的 AI 模型,发布时间为 2022-04-05,定位为 基础大模型,参数规模约为 5400亿,上下文长度为 2K,采用 不开源 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

PaLM

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2022-04-05
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
5400亿 / 不涉及
知识截止
暂无数据
PaLM

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
PaLM

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
PaLM

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
PaLM

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

PaLM

发布机构

Pathways Language Model

模型解读

近年来,为语言理解和生成而训练的大型神经网络在广泛的任务中取得了令人印象深刻的结果。GPT-3首次表明,大型语言模型(LLMs)可用于少量的学习,并且无需大规模的特定任务数据收集或模型参数更新即可取得令人印象深刻的结果。最近的LLM,如GLaM、LaMDA、Gopher和Megatron-Turing NLG,通过扩大模型规模、使用稀疏的激活模块和在更多来源的更大的数据集上进行训练,在许多任务上取得了最先进的几发结果。然而,当我们推动模型规模的极限时,在理解几率学习所出现的能力方面还有很多工作要做。


去年,谷歌研究部宣布了我们对Pathways的愿景,即一个可以跨领域和任务通用的单一模型,同时具有很高的效率。实现这一愿景的一个重要里程碑是开发新的Pathways系统来协调加速器的分布式计算。在 "PaLM:用Pathways扩展语言建模 "中,我们介绍了Pathways语言模型(PaLM),这是一个用Pathways系统训练的5400亿个参数、仅有密集解码器的Transformer模型,它使我们能够在多个TPU v4 Pod上有效地训练一个模型。我们在数百个语言理解和生成任务上对PaLM进行了评估,发现它在大多数任务中实现了最先进的几率性能,在许多情况下都有显著的优势。


DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码