T5

T5

基础大模型T5

Text-to-Text Transfer Transformer

发布时间: 2019-10-23更新于: 2023-03-13 10:15:51.744875
在线体验GitHubHugging FaceCompare
模型参数
110亿
上下文长度
2K
中文支持
不支持
推理能力

Text-to-Text Transfer Transformer 是由 Google Research 发布的 AI 模型,发布时间为 2019-10-23,定位为 基础大模型,参数规模约为 110亿,上下文长度为 2K,模型文件大小约 21GB。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

T5

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
输入/输出模态
暂无数据
发布时间
2019-10-23
模型文件大小
21GB
MoE架构
总参数 / 激活参数
110亿 / 不涉及
知识截止
暂无数据
T5

开源和体验地址

代码开源状态
暂无数据
预训练权重开源
暂无数据
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
T5

官方介绍与博客

T5

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
T5

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

T5

发布机构

Text-to-Text Transfer Transformer

模型解读

T5全称是Text-to-Text Transfer Transformer,是谷歌研究人员在2019年提出的一个研究框架和预训练模型。在2019年,谷歌研究人员已经意识到基于未标注的大量文本数据训练大模型作为下游任务的基础是一种十分高效的自然语言处理方法。这种方法的主要目的是使模型开发通用能力和知识,然后将其转移到下游任务。但是,快速发展的预训练模型让大家难以比较不同的方法。为此,谷歌在这篇论文中提出将NLP领域的预训练任务当作一个text-to-text任务。然后基于这个框架来研究NLP预训练模型。

区别于之前的模型,由于谷歌将预训练任务当作一个text-to-text任务,因此不需要标注数据,也就是不需要BERT那种模型,于是,谷歌提出了T5模型,将NLP领域的问答系统、语言模型等任务都当作了Text-to-Text任务。如下图所示:



值得一提的是,谷歌将T5模型的源代码和预训练模型都公开了。起初是基于TensorFlow的T5模型,然后他们基于JAX重写了该模型,速度和性能都有了更好的提升。


原始T5开源的模型有多个版本:

T5-Small:600万参数,预训练结果地址:gs://t5-data/pretrained_models/small

T5-Base:2.2亿参数,预训练结果地址:gs://t5-data/pretrained_models/base

T5-Large:7.7亿参数,预训练结果地址:gs://t5-data/pretrained_models/large

T5-3B:30亿参数,预训练结果地址:gs://t5-data/pretrained_models/3B

T5-11B:110亿参数,预训练结果地址:gs://t5-data/pretrained_models/11B


官方博客: https://ai.googleblog.com/2020/02/exploring-transfer-learning-with-t5.html 

原版模型: https://github.com/google-research/text-to-text-transfer-transformer 

原版模型预训练文件(checkpoint): https://console.cloud.google.com/storage/browser/t5-data/pretrained_models?pageState=(%22StorageObjectListTable%22:(%22f%22:%22%255B%255D%22))&prefix=&forceOnObjectsSortingFiltering=false 

基于JAX新版模型: https://github.com/google-research/t5x 

新版预训练结果: https://github.com/google-research/text-to-text-transfer-transformer/blob/main/released_checkpoints.md#t511 

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码