大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
5月3日,2个重磅开源的AI模型发布:Replit代码补全大模型和LLaMA复刻版OpenLLaMA发布
重磅数据集公布!LAION-400-Million Open Dataset免费的4亿条图像-文本对数据( LAION-400M:English (image, text) pairs)
狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)
微软发布大语言模型与传统编程语言的集成编程框架——Python版本的Semantic Kernel今日发布
Let's Encrypt的Certbot自动生成证书和自动更新证书
微软开源最强38亿小规模参数大语言模型以及56亿参数规模全模态大模型,但是总体评测结果超过Qwen2.5-7B以及Llama3.1-8B等模型,接近GPT-4o mini。
TensorRT-LLM:英伟达推出的专为提升大模型推理速度优化的全新框架
大型语言模型的新扩展规律(DeepMind新论文)——Training Compute-Optimal Large Language Models