DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
原创博客

原创AI技术博客

探索人工智能与大模型最新资讯与技术博客,涵盖机器学习、深度学习、自然语言处理等领域的原创技术文章与实践案例。

排序方式
按日期排序按浏览量排序
网络爬虫原理

网络爬虫原理

网络爬虫指按照一定的规则(模拟人工登录网页的方式),自动抓取网络上的程序。

2016-09-08 22:03:062,902
#java#网络爬虫
狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)是一种非参数贝叶斯模型,它可以理解为一种聚类方法,但是不需要指定类别数量,它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:5623,519
#dirichletprocessmixturemodel#dpmm
python操作数据库

python操作数据库

python操作数据库

2016-07-21 20:52:302,572
#python#数据库
ItemCF--Python

ItemCF--Python

基于项目最近邻的协同过滤算法,面向的是隐偏好数据,数据格式为<userid,itemid>,测试算法的指标为precision和recall

2016-06-06 15:09:015,333
#个性化推荐
R语言如何将实验结果导出

R语言如何将实验结果导出

使用R语言进行数据分析时,我们经常会遇到实验结果输出的问题,例如使用summary函数时,变量太多,控制台输出的结果不全,那么怎么将结果导出呢?

2016-05-31 20:30:4817,129
#R语言#summary()函数
R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

2016-05-27 19:29:589,463
#R语言#机器学习
R语言操作数据库

R语言操作数据库

R语言操作数据库

2016-05-25 22:00:243,239
#R语言#数据库
参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

这篇博客主要翻译自Gregor Heinrich的技术博客Parameter estimation for text analysis,介绍极大似然估计、极大后验估计和贝叶斯参数估计的原理和案例

2016-05-17 16:27:133,538
#参数估计#极大似然估计
基于PITF模型的个性化标签推荐

基于PITF模型的个性化标签推荐

本文是Steffen Rendle的Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation的译文。

2016-05-08 11:09:474,594
#PITF#张量分解
BPR:面向隐式反馈数据的贝叶斯个性化排序

BPR:面向隐式反馈数据的贝叶斯个性化排序

本文是Steffen Rendle的文章BPR: Bayesian Personalized Ranking from Implicit Feedback的译文

2016-05-08 10:05:484,828
#BPR#排序模型
贝叶斯分析推断的一些基础知识

贝叶斯分析推断的一些基础知识

贝叶斯分析在概率模型中有非常重要的作用,这些年以来比较有影响力的模型如LDA、非参数贝叶斯模型等都是基于贝叶斯分析的。贝叶斯分析有一些非常基础性的知识,在这里我们描述了贝叶斯分析里面的一些基本表示和一些分析准则等内容。

2016-04-08 10:00:147,830
#基础知识#概率
层次贝叶斯模型(一) 之 构建参数化的先验分布

层次贝叶斯模型(一) 之 构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同时使用总体分布将参数的依赖结构化,从而避免过拟合问题。

2016-04-07 08:19:1319,325
#层次模型#统计推断
机器学习中的高斯过程

机器学习中的高斯过程

关于高斯过程,其实网上已经有很多中文博客的介绍了。但是很多中文博客排版实在是太难看了,而且很多内容介绍也不太全面,搞得有点云里雾里的。因此,我想自己发表一个相关的内容,大多数内容来自于英文维基百科和几篇文章。

2016-04-07 08:14:0121,534
#机器学习#统计
Jsoup使用演示

Jsoup使用演示

网络爬虫

2016-04-06 21:32:562,891
#JAVA#网络爬虫
hive数据操作

hive数据操作

hive的使用方法

2016-04-06 21:32:473,262
#hadoop#hive
HttpClient的使用方法案例

HttpClient的使用方法案例

HttpClient的使用方法案例 爬虫

2016-04-06 21:32:332,862
#Java#网络爬虫
Map或Hashtable的value排序

Map或Hashtable的value排序

Map或Hashtable的value排序

2016-04-06 21:31:042,585
#Java#排序
Java读取和操作上G文本数据

Java读取和操作上G文本数据

在处理文本时,经常遇到超过1g存储的数据,直接简单的读取,可能遇到java空间不足的问题,为解决此问题,可将大文本数据按照行进行切分为很多块,并将每一块存储为一个文本

2016-04-06 21:30:433,353
#java#文本挖掘
MySQL调优之SQL语句优化

MySQL调优之SQL语句优化

SQL语句优化

2016-04-05 11:08:233,019
#mysqlsql语句
层次贝叶斯模型(三) 之 共轭层次模型的完整贝叶斯分析

层次贝叶斯模型(三) 之 共轭层次模型的完整贝叶斯分析

我们对层次贝叶斯推断的策略与一般的多参数问题一样,但由于在实际中层次模型的参数很多,所以比较困难。在实际中,我们很难画出联合后验概率分布的图形。但是,我们可以使用近似的基于仿真的方法。 在这个部分,我们提出一个联合了分析的和数值的方法从联合后验分布p(θ, φ|y)中获取仿真结果,以 小鼠肿瘤实验的beta-binormial模型为例,总体分布是p(θ|φ),与似然函数p(y|θ)是共轭的。对于很多非共轭层次模型,更高级的算法将在后面叙述。即使针对更复杂的问题,使用共轭分布来获取近似估计也是很有用的。

2016-04-03 17:15:488,510
#层次模型#统计推断
层次贝叶斯模型(二) 之 互换性和建立层次模型

层次贝叶斯模型(二) 之 互换性和建立层次模型

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规 模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同 时使用总体分布将参数的依赖结构化,从而避免过拟合问题。本节将讲述互换性并建立层次模型

2016-04-03 17:15:437,931
#层次模型#统计推断
Linux权限管理之基本权限

Linux权限管理之基本权限

Linux权限管理之基本权限

2016-03-24 21:38:323,392
#Linux
上一页
1...3839
下一页

专题合集

RAG(检索增强生成)Long Context 长上下文AI Agent 实践

最热博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用

今日推荐

  • OpenAI世界最强的语音识别预训练模型WhisperV2即将来临
  • asd
  • 重磅!MetaAI开源Llama4系列,全面进入MoE架构时代,本次发布Llama4 Scout和Llama4 Maverick,1000万上下文输入,170亿激活参数,不支持中文!
  • ChatGPT即将可以读取谷歌和微软的云盘数据为你管理私有数据!
  • 阿里开源最新Qwen-14B:英文理解能力接近LLaMA2-70B,数学推理能力超过GPT-3.5!
  • Google Gemini Pro多模态接口开放!DataLearnerAI第一时间测试Gemini Pro多模态能力,比想象惊喜!
  • 8个非常好的NLP领域的预训练模型(包含代码和论文资源)
重磅!谷歌开源Gemini同源技术大模型Gemma,分别为70亿参数和20亿参数,同等规模参数评测极其优秀!