DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
Hive的常用语法

Hive的常用语法

Hive的常用语法

2017/02/21 19:26:4411,553
#hive
通过JRI实现java与R的连接、通信

通过JRI实现java与R的连接、通信

R与java调用

2017/02/22 12:03:3520,881
#JRI#R
网络爬虫中URLConnection的使用[以科学网为例]

网络爬虫中URLConnection的使用[以科学网为例]

2017/02/23 10:32:002,593
#网络爬虫
层次狄利克雷过程(Hierarchical Dirichlet Processes)

层次狄利克雷过程(Hierarchical Dirichlet Processes)

Dirichlet过程是一种重要的非参数模型,它可运用在聚类中,自动发现类别的数量。但很多时候,我们的工作都是具有层次话的。这篇文章介绍的层次狄利克雷模型就是解决这样的问题的。

2017/02/27 10:24:5318,208
#DPMM#HDP
张华平分词(又名中科院分词/NLPIR分词)的使用(Java版本)

张华平分词(又名中科院分词/NLPIR分词)的使用(Java版本)

张华平汉语分词系统,现称为NLPIR汉语分词系统,是优秀的中文分词系统。但其使用却有一些配置上的设置是新手可能遇到的一个困难。这里我们简单介绍使用Eclipse导入NLPIR分词系统工程的使用方法。

2017/03/03 20:31:237,283
#分词#工具
分类和Logistic回归

分类和Logistic回归

监督学习中的分类问题和Logistic回归常常被用于推荐问题中关于BPR的研究,但是为什么一定要用Logistic函数来建模和优化呢?本篇博客将带你揭晓奥秘~

2017/03/06 20:58:313,773
#BPR#Logistic回归
Generative Adversarial Networks 生成对抗网络的简单理解

Generative Adversarial Networks 生成对抗网络的简单理解

这几年在机器学习领域最亮最火最耀眼的新思想就是生成对抗网络了。这一思想不光催生了很多篇理论论文,也带来了层出不穷的实际应用。Yann LeCun 本人也曾毫不吝啬地称赞过:这是这几年最棒的想法!

2017/03/08 09:12:0223,309
#GAN#深度学习
TFboys:使用Tensorflow搭建深层网络分类器

TFboys:使用Tensorflow搭建深层网络分类器

使用Tensorflow的高级API - tf.contrib.learn 搭建一个DNN分类器

2017/03/08 09:53:515,267
#DNN#Tensorflow
机器学习之正则化项

机器学习之正则化项

在我们给推荐问题建模时,神秘的正则化项L0、L1、L2的选择对模型很重要。为什么要加正则化?正则化有哪几种形式?到底该选择哪种正则化来建模呢?正则化项与推荐问题的关系?

2017/03/09 14:21:075,993
#L0#L1
推荐模型:显式反馈模型VS隐式反馈模型

推荐模型:显式反馈模型VS隐式反馈模型

推荐中,有研究explict feedback,有研究implict feedback,今天就来谈谈这两种基本模型是怎么建的?其实,都是套路~

2017/03/09 14:22:125,972
#显式反馈模型#隐式反馈模型
Hadoop(一)-HDFS

Hadoop(一)-HDFS

Hadoop(一)-HDFS

2017/03/13 20:04:183,760
#hadoophdfs
通过从零开始实现一个感知机模型,我学到了这些【转载】

通过从零开始实现一个感知机模型,我学到了这些【转载】

本文转自雷锋网,原文《通过从零开始实现一个感知机模型,我学到了这些》,作者:恒亮,文章转载已获授权。感知器(英语:Perceptron)是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈神经网络,是一种二元线性分类器。本文介绍了搭建感知机模型的基本操作也包含了作者的一些心得。

2017/03/14 10:04:253,256
#人工智能#感知机
Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)

Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)

Dirichlet Process and Stick-Breaking(DP的Stick-breaking 构造)

2017/03/14 14:11:085,060
#DP#Stick-Breaking
爬虫聚焦——以新浪微博为例

爬虫聚焦——以新浪微博为例

学爬虫先学思想,思想掌握了,对应代码学习技术就so easy了~

2017/03/29 17:35:124,635
#思想#技术
R语言数据库操作(不定时更新)

R语言数据库操作(不定时更新)

R的数据库连接、操作

2017/04/05 21:27:045,690
#mysql#R
人工神经网络(Artificial Neural Network)算法简介

人工神经网络(Artificial Neural Network)算法简介

人工神经网络,简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或者计算模型。其实是一种与贝叶斯网络很像的一种算法。之前看过一些内容始终云里雾里,这次决定写一篇博客。弄懂这个基本原理,毕竟现在深度学习太火了。

2017/04/10 17:09:0910,635
#人工智能#人工神经网络
深度学习方法:受限玻尔兹曼机RBM【转载】

深度学习方法:受限玻尔兹曼机RBM【转载】

受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是G.Hinton教授的一宝。Hinton教授是深度学习的开山鼻祖,也正是他在2006年的关于深度信念网络DBN的工作,以及逐层预训练的训练方法,开启了深度学习的序章。其中,DBN中在层间的预训练就采用了RBM算法模型。RBM是一种无向图模型,也是一种神经网络模型。

2017/04/10 20:38:003,881
#RBM#受限玻尔兹曼机
忆寺巷

忆寺巷

我出生在一个不大不小的南方城市,那里纵横着大大小小的巷子,而通往我记忆深处的是寺巷子。

2017/04/13 21:48:573,442
#散文#随笔
R语言分析面板数据:简单案例

R语言分析面板数据:简单案例

面板数据,即Panel Data,也叫“平行数据”,是指在时间序列上取多个截面,本文介绍了一个R语言处理面板数据的案例

2017/05/03 16:12:0328,471
#R语言#面板数据
深度学习库

深度学习库

2017/05/08 08:57:402,693
#<span class='blog_tag'><a href='blog_list#tag
Targeted Topic Modeling for Focused Analysis(TTM的理解)

Targeted Topic Modeling for Focused Analysis(TTM的理解)

2017/05/08 21:39:002,612
#主题模型
[翻译]当推荐系统遇上深度学习

[翻译]当推荐系统遇上深度学习

翻译自Wann-Jiun Ma的Deep Learning Meets Recommendation Systems,主要讲了推荐系统的基础算法以及使用深度学习对电影的海报进行近似计算,从而推荐相似的电影。

2017/05/10 16:38:413,896
#推荐系统#深度学习
Gamma函数(伽玛函数)的一阶导数、二阶导数公式推导及java程序

Gamma函数(伽玛函数)的一阶导数、二阶导数公式推导及java程序

gamma函数的相关程序

2017/05/10 20:57:1411,425
#gamma函数
word2vec的使用参数解释和应用场景

word2vec的使用参数解释和应用场景

word2vec的各种程序运行方法

2017/05/10 22:13:527,219
#word2vec
Previous
1234...39
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用

Today's Picks

  • 全球最大(最挣钱)的十大开源企业
  • 需要多少GPU显存才能运行预训练大语言模型?大语言模型参数规模与显存大小的关系估算方法~
  • 抛弃RLHF?MetaAI发布最新大语言模型训练方法:LIMA——仅使用Prompts-Response来微调大模型
  • TensorFlow学习——基本概念(1)
  • Seq2Seq的建模解释和Keras中Simple RNN Cell的计算及其代码示例
  • Git的简介和使用
  • CerebrasAI开源可以在iPhone上运行的30亿参数大模型:BTLM-3B-8K,免费可商用,支持最高8K上下文输入,仅需3GB显存
0基础基于Node.js创建第一个Vue的web项目