大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
如何训练一个大语言模型?当前基于transformer架构的大语言模型的通用训练流程介绍
最新发布!基于推文(tweet)训练的NLP的Python库TweetNLP发布了!
HuggingFace宣布在transformers库中引入首个RNN模型:RWKV,一个结合了RNN与Transformer双重优点的模型
Stable Diffusion的Tensorflow/Keras实现及使用
AI大模型领域的热门技术——Embedding入门介绍以及为什么Embedding在大语言模型中很重要
一个基于Python的机器学习项目——各种Kaggle比赛的解决方案
不更改一行AI模型的代码加速你的模型训练过程——AI模型训练加速库Nebulgym简介
A21 Labs宣布开源520亿参数的全新混合专家大模型(Mixture of Experts,MoE)Jamba:单个GPU的上下文长度是Mixtral 8x7B的三倍