Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

网络爬虫中Json数据的解析

2016-09-09 08:29:173,703

#java #json

网络爬虫之httpclient的使用

2016-09-08 22:11:343,017

#httpclient #Java

网络爬虫之java基础篇QueryRunner（Ⅲ）

网路爬虫数据库操作

2016-09-08 22:10:022,858

#Java #数据库

网络爬虫之基础java集合操作篇

2016-09-08 22:07:542,613

#java #网络爬虫

网络爬虫需要掌握的基础知识

2016-09-08 22:06:082,768

#Java #网络爬虫

网络爬虫原理

网络爬虫指按照一定的规则（模拟人工登录网页的方式），自动抓取网络上的程序。

2016-09-08 22:03:063,006

#java #网络爬虫

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）是一种非参数贝叶斯模型，它可以理解为一种聚类方法，但是不需要指定类别数量，它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:5623,753

#dirichletprocessmixturemodel #dpmm

python操作数据库

2016-07-21 20:52:302,659

#python #数据库

ItemCF--Python

基于项目最近邻的协同过滤算法，面向的是隐偏好数据，数据格式为<userid,itemid>，测试算法的指标为precision和recall

2016-06-06 15:09:015,422

#个性化推荐

R语言如何将实验结果导出

使用R语言进行数据分析时，我们经常会遇到实验结果输出的问题，例如使用summary函数时，变量太多，控制台输出的结果不全，那么怎么将结果导出呢？

2016-05-31 20:30:4817,270

#R语言 #summary()函数

R语言如何根据抽样得到训练集与测试集

2016-05-27 19:29:589,589

#R语言 #机器学习

R语言操作数据库

2016-05-25 22:00:243,361

#R语言 #数据库

参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

这篇博客主要翻译自Gregor Heinrich的技术博客Parameter estimation for text analysis，介绍极大似然估计、极大后验估计和贝叶斯参数估计的原理和案例

2016-05-17 16:27:133,673

#参数估计 #极大似然估计

基于PITF模型的个性化标签推荐

本文是Steffen Rendle的Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation的译文。

2016-05-08 11:09:474,726

#PITF #张量分解

BPR：面向隐式反馈数据的贝叶斯个性化排序

本文是Steffen Rendle的文章BPR: Bayesian Personalized Ranking from Implicit Feedback的译文

2016-05-08 10:05:484,879

#BPR #排序模型

贝叶斯分析推断的一些基础知识

贝叶斯分析在概率模型中有非常重要的作用，这些年以来比较有影响力的模型如LDA、非参数贝叶斯模型等都是基于贝叶斯分析的。贝叶斯分析有一些非常基础性的知识，在这里我们描述了贝叶斯分析里面的一些基本表示和一些分析准则等内容。

2016-04-08 10:00:147,968

#基础知识 #概率

层次贝叶斯模型（一）之构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中，简单的非层次模型可能并不适合层次数据：在很少的参数情况下，它们并不能准确适配大规模数据集，然而，过多的参数则可能导致过拟合的问题。相反，层次模型有足够的参数来拟合数据，同时使用总体分布将参数的依赖结构化，从而避免过拟合问题。

2016-04-07 08:19:1319,525

#层次模型 #统计推断