统计、机器学习与编程知识的原创博客

如何理解狄利克雷过程（Dirichlet Process）

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

2018/01/04 20:10:37 阅读 9171

DirichletProcess/狄利克雷过程/非参贝叶斯

分解机（Factorization Machine, FM）模型简介以及如何使用SGD、ALS和MCMC求解分解机

分解机

2017/11/04 09:27:24 阅读 9213

ALS/MCMC/SGD/分解机/推荐系统

R语言如何根据抽样得到训练集与测试集

2016-05-27 19:29:58 阅读 9317

R语言/机器学习/测试集/训练集

机器学习中MCMC方法介绍

有人把Metropolis算法当作是二十世纪最伟大的十大算法之一。这个算法是大规模抽样算法的一种，也叫做马尔可夫链蒙特卡洛（Markov chain Monte Carlo，MCMC）。对于很多高维问题来说，比如计算一个凸体的体积，MCMC仿真是目前唯一可以在合理时间内解决这个问题的一般性方法。本文介绍了三种主流的MCMC算法，即MH算法、模拟退火算法和吉布斯抽样方法

2016-12-28 20:19:29 阅读 9405

GibbsSampling/MCMC/MH/模拟退火算法

使用Python的sklearn包做kmeans

2018/10/31 14:42:14 阅读 9545

kmeans/python/编程

深度学习之LSTM模型

在前面的博客中，我们已经介绍了基本的RNN模型和GRU深度学习网络，在这篇博客中，我们将介绍LSTM模型，LSTM全称是Long Short-Time Memory，也是RNN模型的一种。

2019/03/23 15:34:00 阅读 9637

LSTM/RNN/深度学习

最强AI对话系统ChatGPT不完全使用指南——已发掘功能展览！

12月1日OpenAI官宣了其目前最强的AI对话系统之后，大家发现这个强大的系统能做的事情远超过大家的想象。我们也在第一时间发布了相关的博客：https://datalearner.com/blog/1051669904657253 。由于这个系统实在是太过强大，大家发现的能力越来越强。连Musk也在几个小时之前感叹这个系统是so much better at bullshit than they are！在这篇博客中，我们将收集关于这个系统目前的使用案例，给大家一个更加全面的展示结果。

2022/12/04 09:10:44 阅读 10023

ChatGPT/GPT/OpenAI

TensorFlow中常见的错误解释及解决方法

2019/11/01 11:21:15 阅读 10138

keras/tensorflow

人工神经网络（Artificial Neural Network）算法简介

人工神经网络，简称神经网络，是一种模仿生物神经网络的结构和功能的数学模型或者计算模型。其实是一种与贝叶斯网络很像的一种算法。之前看过一些内容始终云里雾里，这次决定写一篇博客。弄懂这个基本原理，毕竟现在深度学习太火了。

2017/04/10 17:09:09 阅读 10553

人工智能/人工神经网络/机器学习/神经网络

AdaBoost算法详解以及代码实现

AdaBoost，全称是“Adaptive Boosting”，由Freund和Schapire在1995年首次提出，并在1996发布了一篇新的论文证明其在实际数据集中的效果。这篇博客主要解释AdaBoost的算法详情以及实现。它可以理解为是首个“boosting”方式的集成算法。是一个关注二分类的集成算法。

2019/06/15 09:09:13 阅读 10618

adaboost/集成学习

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

2017-01-16 14:01:22 阅读 10635

HMC/抽样

EM算法简介及其例子

EM（expectation-maximization）算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法，模型一般是依赖于不可观测的潜在变量。

2017/02/06 21:16:28 阅读 10852

EM/参数估计/统计推断

高斯混合模型（GMM）

高斯混合模型是一个参数概率密度函数，它是一组高斯密度函数的加权求和。在生物统计领域，高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

2017/11/30 15:57:04 阅读 10929

混合模型/统计/高斯混合模型

深度学习之GRU神经网络

之前面的博客中，我们已经描述了基本的RNN模型。但是基本的RNN模型有一些缺点难以克服。其中梯度消失问题（Vanishing Gradients）最难以解决。为了解决这个问题，GRU（Gated Recurrent Unit）神经网络应运而生。本篇博客将描述GRU神经网络的工作原理。GRU主要思想来自下面两篇论文：

2019/03/23 15:34:28 阅读 10982

GRU/RNN/深度学习

CNN中的一些高级技术（空洞卷积/显著图/反卷积）

卷积神经网络是图像识别领域最重要的深度学习技术。也可以说是是本轮深度学习浪潮开始点。本文总结了CNN的三种高级技巧，分别是空洞卷积、显著图和反卷积技术。

2019/06/22 15:28:01 阅读 11072

卷积神经网络/深度学习

8个非常好的NLP领域的预训练模型（包含代码和论文资源）

使用预训练模型处理NLP任务是目前深度学习中一个非常火热的领域。本文总结了8个顶级的预训练模型，并提供了每个模型相关的资源（包括官方文档、Github代码和别人已经基于这些模型预训练好的模型等）。

2019/03/23 12:27:49 阅读 11131

NLP/PretrainedModel/深度学习/预训练

Gamma函数(伽玛函数)的一阶导数、二阶导数公式推导及java程序

gamma函数的相关程序

2017/05/10 20:57:14 阅读 11332

gamma函数

Java中矩阵运算(math3的使用)

2017-01-18 20:16:11 阅读 11367

Java/矩阵运算

简单几步教你如何在搭建并使用DALL·E开源版本来基于文字生成图片

大规模的text-to-image模型没有公开预训练结果，OpenAI的意思就是我这玩意太厉害，随便放出来可能会被你们做坏事，而谷歌训练这个应该就是为了云服务挣钱，所以都没有公开可用的版本供大家玩耍。虽然业界有基于论文的实现，但是训练模型需要耗费大量的资源，没有开放的预训练结果，我们普通个人也很难玩起来。但是，大神Sahar提供了一个免费使用开源实现的text-to-image预训练模型的方式。

2022/06/12 18:44:53 阅读 11391

Text-To-Image/图片生成/预训练模型