大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
重磅!阿里开源第三代千问大模型:Qwen3系列,最小仅6亿参数规模,最大2350亿参数规模大模型!可以根据问题难度自动选择是否带思考过程的大模型,评测超DeepSeek-R1和OpenAI o3
LiveCodeBench:全面的 LLM 代码评测基准基准
基于Emebdding的检索增强生成效果不同模型对比:重排序十分有利于检索增强生成的效果
截至目前最强的70亿参数大语言模型:开源可商用的RedPajam 7B完全版发布!
Google开源多模态大模型Gemma3n的正式版:重新定义端侧AI的多模态能力,10B(100亿)参数以下最强多模态大模型,一个月前的预览版正式转正
狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)
加州大学欧文分校信息技术办公室开放基于GPT-4.5的ZotGPT服务测试
预训练大语言模型的三种微调技术总结:fine-tuning、parameter-efficient fine-tuning和prompt-tuning