DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
网络爬虫中的模拟登陆获取数据(实例教学)

网络爬虫中的模拟登陆获取数据(实例教学)

网络爬虫中的模拟登陆获取数据

2016-09-09 08:30:353,079
#java#模拟登陆
网络爬虫中Json数据的解析

网络爬虫中Json数据的解析

网络爬虫中Json数据的解析

2016-09-09 08:29:173,622
#java#json
网络爬虫之httpclient的使用

网络爬虫之httpclient的使用

网络爬虫之httpclient的使用

2016-09-08 22:11:342,957
#httpclient#Java
网络爬虫之java基础篇QueryRunner(Ⅲ)

网络爬虫之java基础篇QueryRunner(Ⅲ)

网路爬虫数据库操作

2016-09-08 22:10:022,803
#Java#数据库
网络爬虫之基础java集合操作篇

网络爬虫之基础java集合操作篇

网络爬虫之基础java集合操作篇

2016-09-08 22:07:542,551
#java#网络爬虫
网络爬虫需要掌握的基础知识

网络爬虫需要掌握的基础知识

网络爬虫需要掌握的基础知识

2016-09-08 22:06:082,681
#Java#网络爬虫
网络爬虫原理

网络爬虫原理

网络爬虫指按照一定的规则(模拟人工登录网页的方式),自动抓取网络上的程序。

2016-09-08 22:03:062,934
#java#网络爬虫
狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)是一种非参数贝叶斯模型,它可以理解为一种聚类方法,但是不需要指定类别数量,它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:5623,572
#dirichletprocessmixturemodel#dpmm
python操作数据库

python操作数据库

python操作数据库

2016-07-21 20:52:302,607
#python#数据库
ItemCF--Python

ItemCF--Python

基于项目最近邻的协同过滤算法,面向的是隐偏好数据,数据格式为<userid,itemid>,测试算法的指标为precision和recall

2016-06-06 15:09:015,365
#个性化推荐
R语言如何将实验结果导出

R语言如何将实验结果导出

使用R语言进行数据分析时,我们经常会遇到实验结果输出的问题,例如使用summary函数时,变量太多,控制台输出的结果不全,那么怎么将结果导出呢?

2016-05-31 20:30:4817,185
#R语言#summary()函数
R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

2016-05-27 19:29:589,502
#R语言#机器学习
R语言操作数据库

R语言操作数据库

R语言操作数据库

2016-05-25 22:00:243,272
#R语言#数据库
参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

参数估计之极大似然估计、极大后验估计和贝叶斯参数估计

这篇博客主要翻译自Gregor Heinrich的技术博客Parameter estimation for text analysis,介绍极大似然估计、极大后验估计和贝叶斯参数估计的原理和案例

2016-05-17 16:27:133,580
#参数估计#极大似然估计
基于PITF模型的个性化标签推荐

基于PITF模型的个性化标签推荐

本文是Steffen Rendle的Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation的译文。

2016-05-08 11:09:474,634
#PITF#张量分解
BPR:面向隐式反馈数据的贝叶斯个性化排序

BPR:面向隐式反馈数据的贝叶斯个性化排序

本文是Steffen Rendle的文章BPR: Bayesian Personalized Ranking from Implicit Feedback的译文

2016-05-08 10:05:484,857
#BPR#排序模型
贝叶斯分析推断的一些基础知识

贝叶斯分析推断的一些基础知识

贝叶斯分析在概率模型中有非常重要的作用,这些年以来比较有影响力的模型如LDA、非参数贝叶斯模型等都是基于贝叶斯分析的。贝叶斯分析有一些非常基础性的知识,在这里我们描述了贝叶斯分析里面的一些基本表示和一些分析准则等内容。

2016-04-08 10:00:147,868
#基础知识#概率
层次贝叶斯模型(一) 之 构建参数化的先验分布

层次贝叶斯模型(一) 之 构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同时使用总体分布将参数的依赖结构化,从而避免过拟合问题。

2016-04-07 08:19:1319,380
#层次模型#统计推断
机器学习中的高斯过程

机器学习中的高斯过程

关于高斯过程,其实网上已经有很多中文博客的介绍了。但是很多中文博客排版实在是太难看了,而且很多内容介绍也不太全面,搞得有点云里雾里的。因此,我想自己发表一个相关的内容,大多数内容来自于英文维基百科和几篇文章。

2016-04-07 08:14:0121,599
#机器学习#统计
Jsoup使用演示

Jsoup使用演示

网络爬虫

2016-04-06 21:32:562,921
#JAVA#网络爬虫
hive数据操作

hive数据操作

hive的使用方法

2016-04-06 21:32:473,297
#hadoop#hive
HttpClient的使用方法案例

HttpClient的使用方法案例

HttpClient的使用方法案例 爬虫

2016-04-06 21:32:332,892
#Java#网络爬虫
Map或Hashtable的value排序

Map或Hashtable的value排序

Map或Hashtable的value排序

2016-04-06 21:31:042,623
#Java#排序
Java读取和操作上G文本数据

Java读取和操作上G文本数据

在处理文本时,经常遇到超过1g存储的数据,直接简单的读取,可能遇到java空间不足的问题,为解决此问题,可将大文本数据按照行进行切分为很多块,并将每一块存储为一个文本

2016-04-06 21:30:433,389
#java#文本挖掘
Previous
1...383940
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署

Today's Picks

  • 开源模型进展迅猛!最新开源不可商用模型Command R+在大模型匿名投票得分上已经超过GPT-4-Turbo!
  • 论文中常见的英语表达
  • Java爬虫入门简介(四)——HttpClient保存使用Cookie登录
  • OpenAI首次发布语音合成大模型:VoiceEngine,一个可以用15秒原始录音就可以克隆声音的语音合成大模型
  • CohereAI开源了2个Aya Vision多模态大模型:80亿和320亿两种规格多模态大模型,评测结果超越Qwen2.5 72B和Llama 3.2 90B,支持23种语言
  • 在消费级显卡上微调OpenAI开源的自动语言识别模型Whisper:8GB显存即可针对你自己的数据建立ASR模型
  • 最全面的Kaggle解决方案和创意清单
  • 如何基于PyTorch来优化大模型训练的内存(显存)使用:8种方法总结