DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
常见的正则表达式写法总结

常见的正则表达式写法总结

正则表达式非常有用,非常强大,但也并不容易写,在这里我们总结一些常用的正则表达式写法

2017/11/18 09:20:502,851
#java#正则表达式
文本预处理的一般步骤和方法

文本预处理的一般步骤和方法

文本预处理是一件极其耗费时间的事情,不仅繁琐而且涉及的细节很多,处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。

2017/11/29 09:58:5114,715
#文本处理#文本挖掘
高斯混合模型(GMM)

高斯混合模型(GMM)

高斯混合模型是一个参数概率密度函数,它是一组高斯密度函数的加权求和。在生物统计领域,高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

2017/11/30 15:57:0411,074
#混合模型#统计
多项式分布的贝叶斯推断

多项式分布的贝叶斯推断

多项式分布是非常常见的分布,他是二项分布在多维上的推广。例如掷骰子结果中,1-6点出现的次数就是一个多项式分布。多项式分布在如主题建模中非常常见,本文将讲述多项式分布的贝叶斯推导过程。

2017/12/01 22:28:466,817
#分布#多项式分布
论文中常见的英语表达

论文中常见的英语表达

英语论文常见表达笔记

2017/12/04 16:28:464,883
#英语#论文
如何理解狄利克雷过程(Dirichlet Process)

如何理解狄利克雷过程(Dirichlet Process)

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

2018/01/04 20:10:379,272
#DirichletProcess#狄利克雷过程
Dirichlet Multinomial Mixture Model做短文本聚类(包括代码)

Dirichlet Multinomial Mixture Model做短文本聚类(包括代码)

2018/03/07 20:22:065,016
#DPMM
主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

2018/03/07 20:24:132,936
#词向量
对比关系生成模型(Comparative Relation Generative Model)

对比关系生成模型(Comparative Relation Generative Model)

2018/03/09 09:00:212,770
#生成模型
机器学习项目流程清单

机器学习项目流程清单

从问题定义,到数据获取以及模型选择调参,这篇博客指出了每个过程中需要注意的问题

2018/03/16 21:54:333,355
#数据挖掘#机器学习
keras解决多标签分类问题

keras解决多标签分类问题

multi-class classification problem和 multi-label classification problem在keras上的实现

2018/03/19 17:24:5314,236
#keras#multi-label
轮盘赌java算例

轮盘赌java算例

2018/03/21 10:42:453,485
#轮盘赌
LFDMM源码剖析(融入词向量的概率图模型)

LFDMM源码剖析(融入词向量的概率图模型)

源码

2018/03/27 14:48:372,863
#源码
梯度下降、牛顿法、拟牛顿法详细介绍

梯度下降、牛顿法、拟牛顿法详细介绍

梯度下降、牛顿法、拟牛顿法详细介绍

2018/03/31 17:53:573,352
#拟牛顿法详细介绍#梯度下降
Git的简介和使用

Git的简介和使用

Git是一个版本控制系统,用来追踪计算机文件的变化的工具,也是一个供多人使用的协同工具。它是一个分布式的版本控制系统,本文将简单介绍如何使用。

2018/04/05 09:51:363,245
#协作#编程
Pseudo-document-based Topic Model(基于伪文档的主题模型)的理解以及源码解读

Pseudo-document-based Topic Model(基于伪文档的主题模型)的理解以及源码解读

2018/04/20 22:13:522,770
#源码
三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

三层Dirichlet 过程(非参贝叶斯模型)-来自Machine Learning

2018/04/20 22:20:243,121
#三层Dirichlet过程
主题模型聚类匹配2018TKDE阅读笔记(Topic Models for Unsupervised Cluster Matching)

主题模型聚类匹配2018TKDE阅读笔记(Topic Models for Unsupervised Cluster Matching)

主题模型聚类匹配

2018/04/24 16:48:573,057
#主题模型聚类匹配
JetBrains的IDEA打包可执行Jar文件以及maven的依赖的方法

JetBrains的IDEA打包可执行Jar文件以及maven的依赖的方法

使用idea打包jar文件的方法

2018/05/01 16:22:514,110
#idea#java
MySQL启用中文全文检索功能

MySQL启用中文全文检索功能

MySQL支持对文本进行全文检索,全文检索可以类似搜索引擎的功能,相比较模糊匹配更加灵活高效且更快。MySQL5.7之后也支持对中文的全文检索,这里描述如何启用MySQL的中文全文检索。

2018/05/09 08:53:543,466
#MySQL#全文检索
stata 用outreg2输出回归结果

stata 用outreg2输出回归结果

stata 输出回归结果

2018/05/18 16:49:3837,938
#stata;outreg2
pip、Anaconda更改国内源以及为当前用户安装

pip、Anaconda更改国内源以及为当前用户安装

如何更改国内源,提升下载速度,以及只为当前用户安装指定包

2018/05/31 11:16:154,057
#pip
你成功啦!!!

你成功啦!!!

模拟登陆

2018/06/22 18:51:412,205
#模拟登陆
《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器

《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器

本文是Effective Java第三版笔记的第一个之创建静态工厂方法而不是使用构造器

2018/09/14 23:06:363,091
#effectivejava#java
Previous
1...567...39
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用

Today's Picks

  • Qwen1.5系列再次更新:阿里巴巴开源320亿参数Qwen1.5-32B模型,评测结果超过Mixtral 8×7B MoE,性价比更高!
  • 如何用7.7亿参数的蒸馏模型超过5400亿的大语言模型——Google提出新的模型蒸馏方法:逐步蒸馏(Distilling step-by-step)详解
  • OpenAI CEO详解今明两年GPT发展计划:10万美元部署私有ChatGPT、最高支持100万tokens、建立微调模型应用市场
  • Text-to-Video来临!——Meta AI发布最新的视频生成预训练模型
  • 目前业界支持中文大语言模型开源和商用许可协议总结
  • Java中自增操作i++与++i的区别
  • 最新好课!从深度学习到stable diffusion的手把手入门教程
  • LLaMA2 7B一样的性能但是由15倍的推理速度!Deci开源DeciLM-6B和DeciLM-6B-Instruct,发布一天上榜HuggingFace Trending