SlimPajama

SlimPajama是一个开源的大模型训练数据集。

发布者:Cerebras

发布时间:2023-06-09

官方网址:https://huggingface.co/datasets/cerebras/SlimPajama-627B

数据记录总数:6270

数据集大小:895GB

SlimPajama
SlimPajama所属的领域
自然语言处理

自然语言处理

Natural Language Process

35个资源

SlimPajama相关的任务
问答系统

问答系统

Question Answering

35个资源