Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

网络爬虫中URLConnection的使用[以科学网为例]

2017/02/23 10:32:002,709

#网络爬虫

通过JRI实现java与R的连接、通信

R与java调用

2017/02/22 12:03:3521,021

#JRI #R

Hive的常用语法

2017/02/21 19:26:4411,670

#hive

Dirichlet Tree Distribution（狄利克雷树分布）

狄利克雷分布作为多项式分布的先验大家应该比较熟悉了。这里介绍另外一种Dirichlet树结构的分布，也可以作为多项式分布的先验，但却更加灵活

2017/02/06 21:17:005,885

#Dirichlet #分布

EM算法简介及其例子

EM（expectation-maximization）算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法，模型一般是依赖于不可观测的潜在变量。

2017/02/06 21:16:2811,071

#EM #参数估计

多元高斯分布（多元正态分布）简介

高斯分布是一种非常常见的分布，对于一元高斯分布我们比较熟悉，对于高斯分布的多元形式有很多人不太理解。这篇博客的材料主要来源Andrew Ng在斯坦福机器学习课的材料。

2017-01-28 23:02:4337,000

#正态分布 #统计基础

Java中矩阵运算(math3的使用)

2017-01-18 20:16:1111,560

#Java #矩阵运算

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

2017-01-16 14:01:2210,883

#HMC #抽样

Author Topic Model[ATM理解及公式推导]

2017-01-13 11:38:434,095

#Gibbs抽样 #TopicModel

LDA的Gibbs抽样详细推理与理解

2017-01-08 21:39:184,422

#Gibbs抽样 #LDA

TF-IDF的java实现(权重排序显示)

2017-01-07 14:15:165,874

#java实现 #TF-IDF

sqoop将mysql数据导入到hive指定的数据库中

sqoop

2017-01-02 20:56:214,420

#mysql #sqoop

Linux环境下使用NLPIR(ICTCLAS)中文分词详解

linux环境下使用中文分词工具

2017-01-02 20:54:514,180

#linux #NLPIR

机器学习中MCMC方法介绍

有人把Metropolis算法当作是二十世纪最伟大的十大算法之一。这个算法是大规模抽样算法的一种，也叫做马尔可夫链蒙特卡洛（Markov chain Monte Carlo，MCMC）。对于很多高维问题来说，比如计算一个凸体的体积，MCMC仿真是目前唯一可以在合理时间内解决这个问题的一般性方法。本文介绍了三种主流的MCMC算法，即MH算法、模拟退火算法和吉布斯抽样方法

2016-12-28 20:19:299,658

#GibbsSampling #MCMC