使用Gradio配合transformers的text streamer实现Llama3-8B-Instruct的网页聊天机器人,流式输出

Llama3系列是MetaAI最新开源的大语言模型。是目前全球最强的开源大模型之一。

基本信息

模型发布时间: 2024-04-18

模型发布机构: Facebook AI研究实验室

模型信息详情: https://www.datalearner.com/ai-models/pretrained-models/Llama3-8B-Instruct

代码GitHub地址: https://github.com/DataLearnerAI/LLMPractice/tree/main/llm_code/llama3

仙宫云一键镜像: https://www.xiangongyun.com/image/detail/613fcb84-d94d-4b42-8584-e18aa7c92964

我们与GPU租赁服务商仙宫云合作,为您提供一键部署的便捷服务。上述镜像链接,您可以直接点击部署即可运行。 仙宫云提供按分钟租赁4090显卡(24GB)显存,因此可以运行120亿参数规模及以下的大语言模型(fp16精度),关于仙宫云的介绍参考:推荐一个国内可以按分钟计费的4090显卡租用公有云,一个小时24GB显存的4090只需要2.37元——仙宫云

注:通过DataLearnerAI专用邀请链接注册会有额外的3元即共8元的赠送额度(自己注册仅有5元额度):https://www.xiangongyun.com/register/6WTXZM

Llama3-8B-Instruct 部署教程简介

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
datalearner-wechat