大模型的发展速度很快,对于需要学习部署使用大模型的人来说,显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云,可以按分钟租用24GB显存的4090显卡公有云实例,非常具有吸引力~
Hugging Face一直在努力支持深度学习,但是,这只是深度学习的一部分。传统统计机器学习领域里面最重要的工具Scikit-learn如今终于和深度学习的开源标杆工具Hugging Face联手。
对于分类特征的处理,sklearn中常见的方法有两种,一种是OneHotEncoder,另一种很多人说是LabelEncoder,其实不对。sklearn中,还有一个OrdinalEncoder,二者似乎一样,但其实并不相同,差别很大。本文将用Kaggle的房价预测的实例来描述如何这些差异以及不同处理对预测算法的影响。
深度学习模型训练将训练批次(batch)设置为2的指数是否有实际价值?
如何构建下一代机器翻译系统——Building Machine Translation Systems for the Next Thousand Languages
MMLU Pro大模型评测基准介绍:MMLU的进化版本,可以更好区分大模型普遍知识和推理能力的通用评测标准
康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架:LLMTune
LM-SYS开源包含人类偏好的3.3万条真实对话语料:可用于RLHF的训练过程!
平衡二叉树之AVL树(Adelson-Velsky and Landis Tree)简介及Java实现