原创博客

原创AI技术博客

探索人工智能与大模型最新资讯与技术博客，涵盖机器学习、深度学习、自然语言处理等领域的原创技术文章与实践案例。

排序方式

按日期排序按浏览量排序

常见的正则表达式写法总结

正则表达式非常有用，非常强大，但也并不容易写，在这里我们总结一些常用的正则表达式写法

2017/11/18 09:20:503,013

#java #正则表达式

文本预处理的一般步骤和方法

文本预处理是一件极其耗费时间的事情，不仅繁琐而且涉及的细节很多，处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。

2017/11/29 09:58:5114,966

#文本处理 #文本挖掘

高斯混合模型（GMM）

高斯混合模型是一个参数概率密度函数，它是一组高斯密度函数的加权求和。在生物统计领域，高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

2017/11/30 15:57:0411,354

#混合模型 #统计

多项式分布的贝叶斯推断

多项式分布是非常常见的分布，他是二项分布在多维上的推广。例如掷骰子结果中，1-6点出现的次数就是一个多项式分布。多项式分布在如主题建模中非常常见，本文将讲述多项式分布的贝叶斯推导过程。

2017/12/01 22:28:466,982

#分布 #多项式分布

论文中常见的英语表达

英语论文常见表达笔记

2017/12/04 16:28:465,033

#英语 #论文

如何理解狄利克雷过程（Dirichlet Process）

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

2018/01/04 20:10:379,507

#DirichletProcess #狄利克雷过程

Dirichlet Multinomial Mixture Model做短文本聚类（包括代码）

2018/03/07 20:22:065,158

#DPMM

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

2018/03/07 20:24:133,052

#词向量

对比关系生成模型(Comparative Relation Generative Model)

2018/03/09 09:00:212,925

#生成模型

机器学习项目流程清单

从问题定义，到数据获取以及模型选择调参，这篇博客指出了每个过程中需要注意的问题

2018/03/16 21:54:333,538

#数据挖掘 #机器学习

keras解决多标签分类问题

multi-class classification problem和 multi-label classification problem在keras上的实现

2018/03/19 17:24:5314,405

#keras #multi-label

轮盘赌java算例

2018/03/21 10:42:453,582

#轮盘赌

LFDMM源码剖析(融入词向量的概率图模型)

源码

2018/03/27 14:48:372,994

#源码

梯度下降、牛顿法、拟牛顿法详细介绍

2018/03/31 17:53:573,518

#拟牛顿法详细介绍 #梯度下降

Git的简介和使用

Git是一个版本控制系统，用来追踪计算机文件的变化的工具，也是一个供多人使用的协同工具。它是一个分布式的版本控制系统，本文将简单介绍如何使用。

2018/04/05 09:51:363,395

#协作 #编程

Pseudo-document-based Topic Model(基于伪文档的主题模型)的理解以及源码解读

2018/04/20 22:13:522,913

#源码

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

2018/04/20 22:20:243,294

#三层Dirichlet过程

主题模型聚类匹配2018TKDE阅读笔记（Topic Models for Unsupervised Cluster Matching）

主题模型聚类匹配

2018/04/24 16:48:573,191

#主题模型聚类匹配

JetBrains的IDEA打包可执行Jar文件以及maven的依赖的方法

使用idea打包jar文件的方法

2018/05/01 16:22:514,272

#idea #java

MySQL启用中文全文检索功能

MySQL支持对文本进行全文检索，全文检索可以类似搜索引擎的功能，相比较模糊匹配更加灵活高效且更快。MySQL5.7之后也支持对中文的全文检索，这里描述如何启用MySQL的中文全文检索。

2018/05/09 08:53:543,630

#MySQL #全文检索

stata 用outreg2输出回归结果

stata 输出回归结果

2018/05/18 16:49:3838,153

#stata；outreg2

pip、Anaconda更改国内源以及为当前用户安装

如何更改国内源，提升下载速度，以及只为当前用户安装指定包

2018/05/31 11:16:154,187

#pip

你成功啦！！！

模拟登陆

2018/06/22 18:51:412,296

#模拟登陆

《Effective Java 第三版》笔记之一创建静态工厂方法而不是使用构造器

本文是Effective Java第三版笔记的第一个之创建静态工厂方法而不是使用构造器

2018/09/14 23:06:363,246

#effectivejava #java