统计、机器学习与编程知识的原创博客

CNN入门算法LeNet-5介绍（论文详细解读）

1998年，LeCun提出了LeNet-5网络用来解决手写识别的问题。LeNet-5被誉为是卷积神经网络的“Hello Word”，足以见到这篇论文的重要性。在此之前，LeCun最早在1989年提出了LeNet-1，并在接下来的几年中继续探索，陆续提出了LeNet-4、Boosted LeNet-4等。本篇博客将详解LeCun的这篇论文，并不是完全翻译，而是总结每一部分的精华内容。

2019/05/26 22:21:20 阅读 15729

卷积神经网络/深度学习

数据特征处理之特征哈希（Feature Hashing）

2018/09/26 16:56:23 阅读 15737

机器学习/特征工程/预处理

实际案例说明AI时代大语言模型三种微调技术的区别——Prompt-Tuning、Instruction-Tuning和Chain-of-Thought

Prompt-Tuning、Instruction-Tuning和Chain-of-Thought是近几年十分流行的大模型训练技术，本文主要介绍这三种技术及其差别。

2023/04/24 22:34:11 阅读 16495

大模型训练

R语言如何将实验结果导出

使用R语言进行数据分析时，我们经常会遇到实验结果输出的问题，例如使用summary函数时，变量太多，控制台输出的结果不全，那么怎么将结果导出呢？

2016-05-31 20:30:48 阅读 16971

R语言/summary()函数/实验结果导出

集成学习（Ensemble Learning）简介及总结

集成学习（Ensemble Learning）是解决有监督机器学习的一类方法，它的思路是基于多个学习算法的集成来获取一个更好的预测结果。本文将介绍相关概念，并对一些注意事项进行总结。

2018/10/08 17:28:05 阅读 17423

有监督的学习/机器学习/集成学习

层次狄利克雷过程（Hierarchical Dirichlet Processes）

Dirichlet过程是一种重要的非参数模型，它可运用在聚类中，自动发现类别的数量。但很多时候，我们的工作都是具有层次话的。这篇文章介绍的层次狄利克雷模型就是解决这样的问题的。

2017/02/27 10:24:53 阅读 18043

DPMM/HDP/统计

层次贝叶斯模型（一）之构建参数化的先验分布

这个系列的博客来自于 Bayesian Data Analysis, Third Edition. By. Andrew Gelman. etl. 的第五章的翻译。实际中，简单的非层次模型可能并不适合层次数据：在很少的参数情况下，它们并不能准确适配大规模数据集，然而，过多的参数则可能导致过拟合的问题。相反，层次模型有足够的参数来拟合数据，同时使用总体分布将参数的依赖结构化，从而避免过拟合问题。

2016-04-07 08:19:13 阅读 19154

层次模型/统计推断/贝叶斯模型

深度学习卷积操作的维度计算（PyTorch/Tensorflow等框架中Conv1d、Conv2d和Conv3d介绍）

卷积操作的维度计算是定义神经网络结构的重要问题，在使用如PyTorch、Tensorflow等深度学习框架搭建神经网络的时候，对每一层输入的维度和输出的维度都必须计算准确，否则容易出错，这里将详细说明相关的维度计算。

2019/05/31 20:27:07 阅读 19831

PyTorch/卷积神经网络/深度学习

SCI/SCIE/SSCI/期刊查询验证方法

本文简要介绍了SCI/SCI-E/SSCI的区别以及相关期刊验证查询方法

2017/11/08 11:15:19 阅读 20411

SCI/SCIE/SSCI/学术/科研

通过JRI实现java与R的连接、通信

R与java调用

2017/02/22 12:03:35 阅读 20805

JRI/R

深度学习基础——激活函数以及什么时候该使用激活函数

这篇博客是来自Analytics Vidhya的一篇文章。写的很不错。

2017/11/04 09:29:27 阅读 20818

深度学习/激活函数

机器学习中的高斯过程

关于高斯过程，其实网上已经有很多中文博客的介绍了。但是很多中文博客排版实在是太难看了，而且很多内容介绍也不太全面，搞得有点云里雾里的。因此，我想自己发表一个相关的内容，大多数内容来自于英文维基百科和几篇文章。

2016-04-07 08:14:01 阅读 21350

机器学习/统计/非参数模型/高斯过程

回归分析方法之岭回归（Ridge Regression）

2018/09/21 09:30:01 阅读 21535

回归分析/统计

用R做面板数据回归（包括静态和动态）

R语言，面板数据，动态回归

2017/05/12 10:33:42 阅读 21853

AppliedEconometricswithR

Generative Adversarial Networks 生成对抗网络的简单理解

这几年在机器学习领域最亮最火最耀眼的新思想就是生成对抗网络了。这一思想不光催生了很多篇理论论文，也带来了层出不穷的实际应用。Yann LeCun 本人也曾毫不吝啬地称赞过：这是这几年最棒的想法！

2017/03/08 09:12:02 阅读 23234

GAN/深度学习/生成对抗网络

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）

狄利克雷过程混合模型（Dirichlet Process Mixture Model, DPMM）是一种非参数贝叶斯模型，它可以理解为一种聚类方法，但是不需要指定类别数量，它可以从数据中推断簇的数量。这篇博客将描述该模型及其求解过程。

2016-08-19 18:04:56 阅读 23378

dirichletprocessmixturemodel/dpmm/混合模型/非参数贝叶斯

多元时间序列数据的预测和建模

2018/09/28 15:44:19 阅读 23669

机器学习/预测

Python中的Pickle操作（pkl文件解释）

您刚刚经历了一个耗时的过程，将一堆数据加载到python对象中。也许你从数千个网站上爬取了数据。也许你计算了pi的数值。如果您的笔记本电脑电池耗尽或python崩溃，您的信息将丢失。 Pickling允许您将python对象保存为硬盘驱动器上的二进制文件。在你pickle你的对象后，你可以结束你的python会话，重新启动你的计算机，然后再次将你的对象加载到python中。

2019/03/11 16:43:55 阅读 24602

python/序列化

GGUF格式的大模型文件是什么意思？gguf是什么格式？如何使用？为什么有GGUF格式的大模型文件？GGUF大模型文件与GGML的差异是啥？

在大模型领域，GGUF是一个非常常见的词语，也是非常常见的大模型预训练结果命名方式。很多人都有疑问gguf是什么格式？很多模型模型，如Yi-34B、Llama2-70B等模型都有对应的GGUF版本，这些版本都模型除了文件名多了GGUF外，其它与原有的模型名称完全一致。那么，GGUF大模型文件格式是什么意思？为什么会有这样的大模型文件，与它一同出现对比的是GGML格式文件，二者的区别是啥？

2024/03/16 21:34:26 阅读 25000

GGML/GGUF/大模型加速/大模型文件格式/大模型量化