大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
Google发布Gemini 2.0 Pro:MMLU Pro评测超过DeepSeek V3略低于DeepSeek R1,最高上下文长度支持200万tokens!开发者每天免费50次请求!
OpenAI开源最新的3D物体生成预训练模型——Point-E
大模型泛化能力详解:大模型泛化能力分类、泛化能力来源和泛化研究的方向
国产开源大模型再添重要玩家:BAAI发布开源可商用大模型Aquila
73亿参数顶级开源模型Mistral-7B升级到v0.2版本,性能与上下文长度均有增强。
Generative Adversarial Networks 生成对抗网络的简单理解
《Effective Java 第三版》笔记之二 当构造参数很多的时候考虑使用builder
可以在手机端运行的大模型标杆:微软发布第三代Phi-3系列模型,评测结果超过同等参数规模水平,包含三个版本,最小38亿,最高140亿参数