DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
文本预处理的一般步骤和方法

文本预处理的一般步骤和方法

文本预处理是一件极其耗费时间的事情,不仅繁琐而且涉及的细节很多,处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。

2017/11/29 09:58:5114,714
#文本处理#文本挖掘
期刊审稿周期查询方法

期刊审稿周期查询方法

科研成果发表速度对于国内的硕士生和博士生来说非常重要,它涉及了同学们的毕业、出国和奖学金等。很多童鞋在投稿之前都希望了解期刊的审稿周期。虽然大多数期刊没有规定明确的审稿时间,但是,随着大家对学术期刊投稿周期的关注,很多学术期刊也开始就自己的审稿速度开始有所要求,本文针对常见的期刊审稿周期提供一个普遍的分析方法。

2022/04/24 22:29:3714,742
#学术期刊
基于GPU的机器学习Python库——RAPIDS简介及其使用方法

基于GPU的机器学习Python库——RAPIDS简介及其使用方法

随着深度学习的火热,对计算机算力的要求越来越高。从2012年AlexNet以来,人们越来越多开始使用GPU加速深度学习的计算。 然而,一些传统的机器学习方法对GPU的利用却很少,这浪费了很多的资源和探索的可能。在这里,我们介绍一个非常优秀的项目——RAPIDS,这是一个致力于将GPU加速带给传统算法的项目,并且提供了与Pandas和scikit-learn一致的用法和体验,非常值得大家尝试。

2019/07/06 10:58:4014,895
#GPU#机器学习
推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)

推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)

本篇博客详细说明了概率矩阵分解(Probabilistic Matrix Factorization,PMF)的推导过程

2017/11/04 09:36:0614,911
#PMF#推荐
使用sklearn做高斯混合聚类(Gaussian Mixture Model)

使用sklearn做高斯混合聚类(Gaussian Mixture Model)

2018/11/01 19:21:5114,992
#python#聚类
深度学习之RNN模型

深度学习之RNN模型

序列数据是生活中很常见的一种数据,如一句话、一段时间某个广告位的流量、一连串运动视频的截图等。在这些数据中也有着很多数据挖掘的需求。RNN就是解决这类问题的一种深度学习方法。其全称是Recurrent Neural Networks,中文是递归神经网络。主要解决序列数据的数据挖掘问题。

2019/03/15 10:57:1215,633
#RNN#深度学习
深度学习的经典算法的论文、解读和代码实现

深度学习的经典算法的论文、解读和代码实现

深度学习是目前最火的算法领域。他在诸多任务中取得的骄人成绩使得其进化越来越好。本文收集深度学习中的经典算法,以及相关的解释和代码实现。

2019/06/03 11:36:4115,797
#深度学习
CNN入门算法LeNet-5介绍(论文详细解读)

CNN入门算法LeNet-5介绍(论文详细解读)

1998年,LeCun提出了LeNet-5网络用来解决手写识别的问题。LeNet-5被誉为是卷积神经网络的“Hello Word”,足以见到这篇论文的重要性。在此之前,LeCun最早在1989年提出了LeNet-1,并在接下来的几年中继续探索,陆续提出了LeNet-4、Boosted LeNet-4等。本篇博客将详解LeCun的这篇论文,并不是完全翻译,而是总结每一部分的精华内容。

2019/05/26 22:21:2015,845
#卷积神经网络#深度学习
数据特征处理之特征哈希(Feature Hashing)

数据特征处理之特征哈希(Feature Hashing)

2018/09/26 16:56:2315,876
#机器学习#特征工程
实际案例说明AI时代大语言模型三种微调技术的区别——Prompt-Tuning、Instruction-Tuning和Chain-of-Thought

实际案例说明AI时代大语言模型三种微调技术的区别——Prompt-Tuning、Instruction-Tuning和Chain-of-Thought

Prompt-Tuning、Instruction-Tuning和Chain-of-Thought是近几年十分流行的大模型训练技术,本文主要介绍这三种技术及其差别。

2023/04/24 22:34:1116,706
#大模型训练
R语言如何将实验结果导出

R语言如何将实验结果导出

使用R语言进行数据分析时,我们经常会遇到实验结果输出的问题,例如使用summary函数时,变量太多,控制台输出的结果不全,那么怎么将结果导出呢?

2016-05-31 20:30:4817,063
#R语言#summary()函数
集成学习(Ensemble Learning)简介及总结

集成学习(Ensemble Learning)简介及总结

集成学习(Ensemble Learning)是解决有监督机器学习的一类方法,它的思路是基于多个学习算法的集成来获取一个更好的预测结果。本文将介绍相关概念,并对一些注意事项进行总结。

2018/10/08 17:28:0517,521
#有监督的学习#机器学习
层次狄利克雷过程(Hierarchical Dirichlet Processes)

层次狄利克雷过程(Hierarchical Dirichlet Processes)

Dirichlet过程是一种重要的非参数模型,它可运用在聚类中,自动发现类别的数量。但很多时候,我们的工作都是具有层次话的。这篇文章介绍的层次狄利克雷模型就是解决这样的问题的。

2017/02/27 10:24:5318,208
#DPMM#HDP
层次贝叶斯模型(一) 之 构建参数化的先验分布

层次贝叶斯模型(一) 之 构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同时使用总体分布将参数的依赖结构化,从而避免过拟合问题。

2016-04-07 08:19:1319,252
#层次模型#统计推断
深度学习卷积操作的维度计算(PyTorch/Tensorflow等框架中Conv1d、Conv2d和Conv3d介绍)

深度学习卷积操作的维度计算(PyTorch/Tensorflow等框架中Conv1d、Conv2d和Conv3d介绍)

卷积操作的维度计算是定义神经网络结构的重要问题,在使用如PyTorch、Tensorflow等深度学习框架搭建神经网络的时候,对每一层输入的维度和输出的维度都必须计算准确,否则容易出错,这里将详细说明相关的维度计算。

2019/05/31 20:27:0719,992
#PyTorch#卷积神经网络
SCI/SCIE/SSCI/期刊查询验证方法

SCI/SCIE/SSCI/期刊查询验证方法

本文简要介绍了SCI/SCI-E/SSCI的区别以及相关期刊验证查询方法

2017/11/08 11:15:1920,566
#SCI#SCIE
通过JRI实现java与R的连接、通信

通过JRI实现java与R的连接、通信

R与java调用

2017/02/22 12:03:3520,881
#JRI#R
深度学习基础——激活函数以及什么时候该使用激活函数

深度学习基础——激活函数以及什么时候该使用激活函数

这篇博客是来自Analytics Vidhya的一篇文章。写的很不错。

2017/11/04 09:29:2720,942
#深度学习#激活函数
机器学习中的高斯过程

机器学习中的高斯过程

关于高斯过程,其实网上已经有很多中文博客的介绍了。但是很多中文博客排版实在是太难看了,而且很多内容介绍也不太全面,搞得有点云里雾里的。因此,我想自己发表一个相关的内容,大多数内容来自于英文维基百科和几篇文章。

2016-04-07 08:14:0121,462
#机器学习#统计
回归分析方法之岭回归(Ridge Regression)

回归分析方法之岭回归(Ridge Regression)

2018/09/21 09:30:0121,632
#回归分析#统计
用R做面板数据回归(包括静态和动态)

用R做面板数据回归(包括静态和动态)

R语言,面板数据,动态回归

2017/05/12 10:33:4221,914
#AppliedEconometricswithR
Generative Adversarial Networks 生成对抗网络的简单理解

Generative Adversarial Networks 生成对抗网络的简单理解

这几年在机器学习领域最亮最火最耀眼的新思想就是生成对抗网络了。这一思想不光催生了很多篇理论论文,也带来了层出不穷的实际应用。Yann LeCun 本人也曾毫不吝啬地称赞过:这是这几年最棒的想法!

2017/03/08 09:12:0223,310
#GAN#深度学习
狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)

狄利克雷过程混合模型(Dirichlet Process Mixture Model, DPMM)是一种非参数贝叶斯模型,它可以理解为一种聚类方法,但是不需要指定类别数量,它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:5623,511
#dirichletprocessmixturemodel#dpmm
多元时间序列数据的预测和建模

多元时间序列数据的预测和建模

2018/09/28 15:44:1923,809
#机器学习#预测
Previous
1...373839
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用

Today's Picks

  • OpenAI最新动向,Sam不再回归OpenAI,与Greg一起进入微软!OpenAI新任CEO由Emmett Shear接任!
  • GGUF格式的大模型文件是什么意思?gguf是什么格式?如何使用?为什么有GGUF格式的大模型文件?GGUF大模型文件与GGML的差异是啥?
  • 强化学习进入分布式时代——DeepMind分布式强化学习框架ACME发布
  • Qwen1.5系列再次更新:阿里巴巴开源320亿参数Qwen1.5-32B模型,评测结果超过Mixtral 8×7B MoE,性价比更高!
  • 人工智能颠覆影响者营销的八种方式
  • 主题模型聚类匹配2018TKDE阅读笔记(Topic Models for Unsupervised Cluster Matching)
  • Keras框架下的保存模型和加载模型
  • Python中的Pickle操作(pkl文件解释)