大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
StabilityAI发布实时文本生成图片大模型SDXL Turbo——生成一张图片可能只需要0.207秒
LM-SYS开源包含人类偏好的3.3万条真实对话语料:可用于RLHF的训练过程!
ManusAI产品介绍和特点总结,以及用户对该产品的评价总结,背后的开发团队介绍
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:MMLU评测接近Llama-3-70B,略超Mixtral-8×22B!
马斯克大模型企业xAI开源Grok-1,截止目前全球规模最大的MoE大模型,词汇表超过13万!
自然语言处理中常见的字节编码对(Byte-Pair Encoding,BPE)简介
Anthropic的Claude 4即将发布前新功能曝光:带有Thinking模式,且可以看到推理过程