大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
Dask concat throws ValueError: Shape of passed values is (xxx, xxx), indices imply (xxx, xxx)
让大语言模型为文本处理提提速:Scikit-learn与LLM的合体Scikit-LLM开源项目发布
开源领域大语言模型再上台阶:Databricks开源1320亿参数规模的混合专家大语言模型DBRX-16×12B,评测表现超过Mixtral-8×7B-MoE,免费商用授权!
又一个国产开源大模型发布:前腾讯创始人创业公司元象发布XVERSE-13B,超过Baichuan-13B,与ChatGLM2-12B齐平!但免费商用授权!
阿里巴巴的第二代通义千问可能即将发布:Qwen2相关信息已经提交HuggingFace官方的transformers库
重磅!GPT-3.5可以微调了!OpenAI发布GPT-3.5 Turbo微调接口
全球最大的39亿参数的text-to-image预训练模型发布
大语言模型的技术总结系列一:RNN与Transformer架构的区别以及为什么Transformer更好
多元正态(高斯)分布的贝叶斯推导(Bayesian Inference for the Multivariate Normal)