标签为 #深度学习# 的博客 | 数据学习(Datalearner)

★ 【置顶】推荐一个国内可以按分钟计费的4090显卡租用公有云，一个小时24GB显存的4090只需要2.37元——仙宫云

大模型的发展速度很快，对于需要学习部署使用大模型的人来说，显卡是一个必不可少的资源。使用公有云租用显卡对于初学者和技术验证来说成本很划算。DataLearnerAI在此推荐一个国内的合法的按分钟计费的4090显卡公有云服务提供商仙宫云，可以按分钟租用24GB显存的4090显卡公有云实例，非常具有吸引力~

4090显卡/仙宫云/显卡公有云/显卡租赁

Card image cap

检索增强生成（RAG）

大模型检索增强生成是一种结合了大规模语言模型的自动生成能力和针对特定数据的检索机制，以提供更准确、信息丰富的输出内容的技术。

查看RAG合集

Card image cap

Long Context

大模型对长上下文的处理能力在于它们能够理解和维持较长篇幅的文本连贯性，有助于提升质量，以及对复杂问题和讨论的理解和回应质量。

LongContext合集

Card image cap

AI Agent

大模型的AI Agent是一种高级智能系统，能够理解复杂的指令和查询，并以人类般的方式生成响应、执行任务或提供决策支持。

AI Agent合集

正则项的理解之正则从哪里来

在机器学习或者深度学习中，正则项是我们经常遇到的概念。它对提高模型的准确性和泛化能力非常重要。本文详细描述了正则项的来源以及与其他概念的相关关系。

2017/11/06 17:02:19

14109

人工智能/机器学习/正则化/正则项/深度学习

深度学习基础——激活函数以及什么时候该使用激活函数

深度学习基础——激活函数以及什么时候该使用激活函数

这篇博客是来自Analytics Vidhya的一篇文章。写的很不错。

2017/11/04 09:29:27

20662

深度学习/激活函数

给初学者的深度学习简介

深度学习是计算机领域中目前非常火的话题，不仅在学术界有很多论文，在业界也有很多实际运用。本篇博客主要介绍了三种基本的深度学习的架构，并对深度学习的原理作了简单的描述。本篇文章翻译自Medium上一篇入门介绍。

2017/10/16 17:05:57

6980

深度学习/神经网络

[翻译]应用到文本领域的卷积方法

[翻译]应用到文本领域的卷积方法

本文介绍了文本领域的相关任务和技术，探讨了循环神经网络在文本领域的优势，并进一步研究了应用在文本领域的卷积网络方法，原文地址：https://medium.com/@TalPerry/convolutional-methods-for-text-d5260fd5675f

2017/05/27 15:50:25

4884

RNN/卷积神经网络/文本处理/深度学习

生成对抗网络简介（包含TensorFlow代码示例）【翻译】

生成对抗网络简介（包含TensorFlow代码示例）【翻译】

这篇博客是AYLIEN上的一篇关于生成对抗网络的简单介绍，包含非常简洁的代码示例。是入门非常好的材料。

2017/05/15 14:40:57

7698

TensorFlow/深度学习/生成对抗网络/神经网络

[翻译]当推荐系统遇上深度学习

[翻译]当推荐系统遇上深度学习

翻译自Wann-Jiun Ma的Deep Learning Meets Recommendation Systems，主要讲了推荐系统的基础算法以及使用深度学习对电影的海报进行近似计算，从而推荐相似的电影。

2017/05/10 16:38:41

3795

推荐系统/深度学习/电影推荐

Generative Adversarial Networks 生成对抗网络的简单理解

Generative Adversarial Networks 生成对抗网络的简单理解

这几年在机器学习领域最亮最火最耀眼的新思想就是生成对抗网络了。这一思想不光催生了很多篇理论论文，也带来了层出不穷的实际应用。Yann LeCun 本人也曾毫不吝啬地称赞过：这是这几年最棒的想法！

2017/03/08 09:12:02

23173

GAN/深度学习/生成对抗网络

今日推荐

Java爬虫入门简介（四）——HttpClient保存使用Cookie登录

通过JRI实现java与R的连接、通信

AdaBoost算法详解以及代码实现

如何训练你自己的大语言模型？——来自Replit一线工程师的亲身经验

一张图看全深度学习中下层软硬件体系结构

平衡二叉树之AVL树（Adelson-Velsky and Landis Tree）简介及Java实现

生成式AI领域拓展！MetaAI开源AudioCraft：一个支持AudioGen、MusicGen等模型的音频生成开发框架

开源王者！全球最强的开源大模型Llama3发布！15万亿数据集训练，最高4000亿参数，数学评测超过GPT-4，全球第二！

使用Spring Security进行登录验证

重磅！Meta发布LLaMA2，最高700亿参数，在2万亿tokens上训练，各项得分远超第一代LLaMA~完全免费可商用！

最热博客

Dirichlet Distribution（狄利克雷分布）与Dirichlet Process（狄利克雷过程）

回归模型中的交互项简介（Interactions in Regression）

贝塔分布（Beta Distribution）简介及其应用

矩母函数简介（Moment-generating function）

普通最小二乘法（Ordinary Least Squares，OLS）的详细推导过程

使用R语言进行K-means聚类并分析结果

深度学习技巧之Early Stopping（早停法）

H5文件简介和使用

手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Wishart分布简介