DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by
Sort by DateSort by Views
变分推断之高斯混合模型(案例及代码)

变分推断之高斯混合模型(案例及代码)

变分推断以及高斯混合模型应用

2019/02/14 15:44:168,386
#变分推断#高斯混合模型
扩散模型是如何工作的:从0开始的数学原理——How diffusion models work: the math from scratch

扩散模型是如何工作的:从0开始的数学原理——How diffusion models work: the math from scratch

随着DALL·E2的发布,大家发现Text-to-Image居然可以取得如此好的效果。也让diffusion模型变得非常受欢迎。扩散模型虽然火热,但是背后的数学原理可能很多人也不太了解。这篇博客不仅介绍了扩散模型背后的数学原理,也讲述了如何训练扩散模型以及提高扩散模型训练效率的种种技巧,十分值得大家钻研。

2022/10/05 17:46:248,423
#DALLE#StableDiffusion
层次贝叶斯模型(三) 之 共轭层次模型的完整贝叶斯分析

层次贝叶斯模型(三) 之 共轭层次模型的完整贝叶斯分析

我们对层次贝叶斯推断的策略与一般的多参数问题一样,但由于在实际中层次模型的参数很多,所以比较困难。在实际中,我们很难画出联合后验概率分布的图形。但是,我们可以使用近似的基于仿真的方法。 在这个部分,我们提出一个联合了分析的和数值的方法从联合后验分布p(θ, φ|y)中获取仿真结果,以 小鼠肿瘤实验的beta-binormial模型为例,总体分布是p(θ|φ),与似然函数p(y|θ)是共轭的。对于很多非共轭层次模型,更高级的算法将在后面叙述。即使针对更复杂的问题,使用共轭分布来获取近似估计也是很有用的。

2016-04-03 17:15:488,441
#层次模型#统计推断
深度学习的标准符号表示

深度学习的标准符号表示

深度学习中的符号很多,但是大多数情况下,大家都使用同一套符号来表示。这篇博客主要以一个简单的神经网络为例,说明深度学习的标准符号以及相关的维度表示。主要来源是吴恩达的coursera课程。

2019/02/21 20:16:408,703
#深度学习
一张图总结大语言模型的技术分类、现状和开源情况

一张图总结大语言模型的技术分类、现状和开源情况

4月26日,亚马逊联合其它高校科研人员发表了一篇关于如何使用ChatGPT完成下游论文。里面使用了一个非常直观明了的大语言模型进化图总结了目前当前大语言模型的技术架构分类和开源现状,十分受欢迎。因此,4月30日,作者再次更新这幅图,增加了更多的大语言模型。

2023/06/13 09:41:418,911
#LLM#大语言模型
origin绘图操作案例(1)

origin绘图操作案例(1)

日常绘图时,会使用都origin,其是一款非常强大的制图工具

2017/11/17 10:47:569,109
#origin#论文制图
CNN经典算法AlexNet介绍

CNN经典算法AlexNet介绍

2012年发表的AlexNet可以算是开启本轮深度学习浪潮的开山之作了。由于AlexNet在ImageNet LSVRC-2012(Large Scale Visual Recognition Competition)赢得第一名,并且错误率只有15.3%(第二名是26.2%),引起了巨大的反响。相比较之前的深度学习网络结构,AlexNet主要的变化在于激活函数采用了Relu、使用Dropout代替正则降低过拟合等。本篇博客将根据其论文,详细讲述AlexNet的网络结构及其特点。

2019/06/20 10:28:169,262
#卷积神经网络#深度学习
如何理解狄利克雷过程(Dirichlet Process)

如何理解狄利克雷过程(Dirichlet Process)

狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型

2018/01/04 20:10:379,272
#DirichletProcess#狄利克雷过程
分解机(Factorization Machine, FM)模型简介以及如何使用SGD、ALS和MCMC求解分解机

分解机(Factorization Machine, FM)模型简介以及如何使用SGD、ALS和MCMC求解分解机

分解机

2017/11/04 09:27:249,284
#ALS#MCMC
R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

R语言如何根据抽样得到训练集与测试集

2016-05-27 19:29:589,398
#R语言#机器学习
机器学习中MCMC方法介绍

机器学习中MCMC方法介绍

有人把Metropolis算法当作是二十世纪最伟大的十大算法之一。这个算法是大规模抽样算法的一种,也叫做马尔可夫链蒙特卡洛(Markov chain Monte Carlo,MCMC)。对于很多高维问题来说,比如计算一个凸体的体积,MCMC仿真是目前唯一可以在合理时间内解决这个问题的一般性方法。本文介绍了三种主流的MCMC算法,即MH算法、模拟退火算法和吉布斯抽样方法

2016-12-28 20:19:299,503
#GibbsSampling#MCMC
使用Python的sklearn包做kmeans

使用Python的sklearn包做kmeans

2018/10/31 14:42:149,623
#kmeans#python
深度学习之LSTM模型

深度学习之LSTM模型

在前面的博客中,我们已经介绍了基本的RNN模型和GRU深度学习网络,在这篇博客中,我们将介绍LSTM模型,LSTM全称是Long Short-Time Memory,也是RNN模型的一种。

2019/03/23 15:34:009,726
#LSTM#RNN
Pycharm更改内存设置

Pycharm更改内存设置

2018/10/31 15:39:589,894
#IDE#pycharm
最强AI对话系统ChatGPT不完全使用指南——已发掘功能展览!

最强AI对话系统ChatGPT不完全使用指南——已发掘功能展览!

12月1日OpenAI官宣了其目前最强的AI对话系统之后,大家发现这个强大的系统能做的事情远超过大家的想象。我们也在第一时间发布了相关的博客:https://datalearner.com/blog/1051669904657253 。由于这个系统实在是太过强大,大家发现的能力越来越强。连Musk也在几个小时之前感叹这个系统是so much better at bullshit than they are!在这篇博客中,我们将收集关于这个系统目前的使用案例,给大家一个更加全面的展示结果。

2022/12/04 09:10:4410,102
#ChatGPT#GPT
TensorFlow中常见的错误解释及解决方法

TensorFlow中常见的错误解释及解决方法

TensorFlow中常见的错误解释及解决方法

2019/11/01 11:21:1510,231
#keras#tensorflow
人工神经网络(Artificial Neural Network)算法简介

人工神经网络(Artificial Neural Network)算法简介

人工神经网络,简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或者计算模型。其实是一种与贝叶斯网络很像的一种算法。之前看过一些内容始终云里雾里,这次决定写一篇博客。弄懂这个基本原理,毕竟现在深度学习太火了。

2017/04/10 17:09:0910,635
#人工智能#人工神经网络
AdaBoost算法详解以及代码实现

AdaBoost算法详解以及代码实现

AdaBoost,全称是“Adaptive Boosting”,由Freund和Schapire在1995年首次提出,并在1996发布了一篇新的论文证明其在实际数据集中的效果。这篇博客主要解释AdaBoost的算法详情以及实现。它可以理解为是首个“boosting”方式的集成算法。是一个关注二分类的集成算法。

2019/06/15 09:09:1310,706
#adaboost#集成学习
HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

HMC(Hamiltonian Monte Carlo抽样算法详细介绍)

2017-01-16 14:01:2210,726
#HMC#抽样
EM算法简介及其例子

EM算法简介及其例子

EM(expectation-maximization)算法是统计学中求统计模型的最大似然和最大后验参数估计的一种迭代式算法,模型一般是依赖于不可观测的潜在变量。

2017/02/06 21:16:2810,924
#EM#参数估计
深度学习之GRU神经网络

深度学习之GRU神经网络

之前面的博客中,我们已经描述了基本的RNN模型。但是基本的RNN模型有一些缺点难以克服。其中梯度消失问题(Vanishing Gradients)最难以解决。为了解决这个问题,GRU(Gated Recurrent Unit)神经网络应运而生。本篇博客将描述GRU神经网络的工作原理。GRU主要思想来自下面两篇论文:

2019/03/23 15:34:2811,059
#GRU#RNN
高斯混合模型(GMM)

高斯混合模型(GMM)

高斯混合模型是一个参数概率密度函数,它是一组高斯密度函数的加权求和。在生物统计领域,高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。

2017/11/30 15:57:0411,074
#混合模型#统计
CNN中的一些高级技术(空洞卷积/显著图/反卷积)

CNN中的一些高级技术(空洞卷积/显著图/反卷积)

卷积神经网络是图像识别领域最重要的深度学习技术。也可以说是是本轮深度学习浪潮开始点。本文总结了CNN的三种高级技巧,分别是空洞卷积、显著图和反卷积技术。

2019/06/22 15:28:0111,198
#卷积神经网络#深度学习
8个非常好的NLP领域的预训练模型(包含代码和论文资源)

8个非常好的NLP领域的预训练模型(包含代码和论文资源)

使用预训练模型处理NLP任务是目前深度学习中一个非常火热的领域。本文总结了8个顶级的预训练模型,并提供了每个模型相关的资源(包括官方文档、Github代码和别人已经基于这些模型预训练好的模型等)。

2019/03/23 12:27:4911,230
#NLP#PretrainedModel
Previous
1...35363739
Next

Topic Collections

RAG (Retrieval-Augmented Generation)Long Context (Large Language Models)AI Agent Practices

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8H5文件简介和使用

Today's Picks

  • Qwen1.5系列再次更新:阿里巴巴开源320亿参数Qwen1.5-32B模型,评测结果超过Mixtral 8×7B MoE,性价比更高!
  • 如何用7.7亿参数的蒸馏模型超过5400亿的大语言模型——Google提出新的模型蒸馏方法:逐步蒸馏(Distilling step-by-step)详解
  • OpenAI CEO详解今明两年GPT发展计划:10万美元部署私有ChatGPT、最高支持100万tokens、建立微调模型应用市场
  • Text-to-Video来临!——Meta AI发布最新的视频生成预训练模型
  • 目前业界支持中文大语言模型开源和商用许可协议总结
  • Java中自增操作i++与++i的区别
  • 最新好课!从深度学习到stable diffusion的手把手入门教程
  • LLaMA2 7B一样的性能但是由15倍的推理速度!Deci开源DeciLM-6B和DeciLM-6B-Instruct,发布一天上榜HuggingFace Trending