DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tools

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
分类和Logistic回归

分类和Logistic回归

监督学习中的分类问题和Logistic回归常常被用于推荐问题中关于BPR的研究,但是为什么一定要用Logistic函数来建模和优化呢?本篇博客将带你揭晓奥秘~

2017/03/06 20:58:313,826
#BPR#Logistic回归
张华平分词(又名中科院分词/NLPIR分词)的使用(Java版本)

张华平分词(又名中科院分词/NLPIR分词)的使用(Java版本)

张华平汉语分词系统,现称为NLPIR汉语分词系统,是优秀的中文分词系统。但其使用却有一些配置上的设置是新手可能遇到的一个困难。这里我们简单介绍使用Eclipse导入NLPIR分词系统工程的使用方法。

2017/03/03 20:31:237,382
#分词#工具
层次狄利克雷过程(Hierarchical Dirichlet Processes)

层次狄利克雷过程(Hierarchical Dirichlet Processes)

Dirichlet过程是一种重要的非参数模型,它可运用在聚类中,自动发现类别的数量。但很多时候,我们的工作都是具有层次话的。这篇文章介绍的层次狄利克雷模型就是解决这样的问题的。

2017/02/27 10:24:5318,320
#DPMM#HDP
网络爬虫中URLConnection的使用[以科学网为例]

网络爬虫中URLConnection的使用[以科学网为例]

2017/02/23 10:32:002,649
#网络爬虫
通过JRI实现java与R的连接、通信

通过JRI实现java与R的连接、通信

R与java调用

2017/02/22 12:03:3520,943
#JRI#R
Hive的常用语法

Hive的常用语法

Hive的常用语法

2017/02/21 19:26:4411,612
#hive
Dirichlet Tree Distribution(狄利克雷树分布)

Dirichlet Tree Distribution(狄利克雷树分布)

狄利克雷分布作为多项式分布的先验大家应该比较熟悉了。这里介绍另外一种Dirichlet树结构的分布,也可以作为多项式分布的先验,但却更加灵活

2017/02/06 21:17:005,810
#Dirichlet#分布
EM算法简介及其例子

EM算法简介及其例子

EM(expectation-maximization)算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法,模型一般是依赖于不可观测的潜在变量。

2017/02/06 21:16:2810,995
#EM#参数估计
多元高斯分布(多元正态分布)简介

多元高斯分布(多元正态分布)简介

高斯分布是一种非常常见的分布,对于一元高斯分布我们比较熟悉,对于高斯分布的多元形式有很多人不太理解。这篇博客的材料主要来源Andrew Ng在斯坦福机器学习课的材料。

2017-01-28 23:02:4336,900
#正态分布#统计基础
Java中矩阵运算(math3的使用)

Java中矩阵运算(math3的使用)

Java中矩阵运算(math3的使用)

2017-01-18 20:16:1111,498
#Java#矩阵运算
HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

2017-01-16 14:01:2210,801
#HMC#抽样
Author Topic Model[ATM理解及公式推导]

Author Topic Model[ATM理解及公式推导]

Author Topic Model[ATM理解及公式推导]

2017-01-13 11:38:434,049
#Gibbs抽样#TopicModel
LDA的Gibbs抽样详细推理与理解

LDA的Gibbs抽样详细推理与理解

LDA的Gibbs抽样详细推理与理解

2017-01-08 21:39:184,363
#Gibbs抽样#LDA
TF-IDF的java实现(权重排序显示)

TF-IDF的java实现(权重排序显示)

TF-IDF的java实现(权重排序显示)

2017-01-07 14:15:165,825
#java实现#TF-IDF
sqoop将mysql数据导入到hive指定的数据库中

sqoop将mysql数据导入到hive指定的数据库中

sqoop

2017-01-02 20:56:214,374
#mysql#sqoop
Linux环境下使用NLPIR(ICTCLAS)中文分词详解

Linux环境下使用NLPIR(ICTCLAS)中文分词详解

linux环境下使用中文分词工具

2017-01-02 20:54:514,112
#linux#NLPIR
机器学习中MCMC方法介绍

机器学习中MCMC方法介绍

有人把Metropolis算法当作是二十世纪最伟大的十大算法之一。这个算法是大规模抽样算法的一种,也叫做马尔可夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)。对于很多高维问题来说,比如计算一个凸体的体积,MCMC仿真是目前唯一可以在合理时间内解决这个问题的一般性方法。本文介绍了三种主流的MCMC算法,即MH算法、模拟退火算法和吉布斯抽样方法

2016-12-28 20:19:299,578
#GibbsSampling#MCMC
贝叶斯统计中的计算方法简介

贝叶斯统计中的计算方法简介

仿真抽样是给予贝叶斯方法第二春的重要角色。由于很多时候实际问题很复杂,我们无法精确求出后验密度,使用仿真抽样的方法我们可以获得近似的结果。这篇博客主要介绍了几种仿真抽样的方法。

2016-12-28 20:05:216,838
#MCMC#仿真
Eclipse打包Java工程并导出jar包

Eclipse打包Java工程并导出jar包

使用eclipse打包java工程并导出java包

2016-12-12 20:48:123,578
#程序
如何把一个目录下的所有文件,合并成一个文件

如何把一个目录下的所有文件,合并成一个文件

java 读写操作

2016-10-11 09:14:463,258
#java#数据处理
 Java多线程网络爬虫(时光网为例)

Java多线程网络爬虫(时光网为例)

Java多线程网络爬虫(时光网为例)

2016-09-26 08:27:063,561
#Java#网络爬虫
Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

Scrapy网络爬虫实战[保存为Json文件及存储到mysql数据库]

2016-09-18 16:09:096,417
#python#网络爬虫框架
python中Scrapy的安装详细过程

python中Scrapy的安装详细过程

python中Scrapy的安装详细过程

2016-09-18 08:34:003,092
#python#网络爬虫
python中Scrapy的安装详细过程

python中Scrapy的安装详细过程

python中Scrapy的安装详细过程

2016-09-18 08:30:302,815
#python#网络爬虫
Previous
1...37383940
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Today's Picks

  • R语言操作数据库
  • hive数据操作
  • Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)
  • Python编程环境搭建——小白起步教程!
  • 层次贝叶斯模型(三) 之 共轭层次模型的完整贝叶斯分析
  • Google发布全新Gemini 2.5 Flash Lite:极致速度与性价比的轻量级新选择,实测生成速度最高可超过400 tokens/每秒,能力喜人!堪称甜品级大模型!
  • OpenAI发布新一代向量大模型,接口已经更新到text-embedding-3-large,embedding长度升级,价格最高下降5倍!
大语言模型的技术总结系列一:RNN与Transformer架构的区别以及为什么Transformer更好