人工智能与大模型最新资讯与技术博客

100天搞定机器学习（100-Days-Of-ML）（一）数据预处理

2019/07/06 20:46:50 阅读 3814

机器学习

基于GPU的机器学习Python库——RAPIDS简介及其使用方法

随着深度学习的火热，对计算机算力的要求越来越高。从2012年AlexNet以来，人们越来越多开始使用GPU加速深度学习的计算。然而，一些传统的机器学习方法对GPU的利用却很少，这浪费了很多的资源和探索的可能。在这里，我们介绍一个非常优秀的项目——RAPIDS，这是一个致力于将GPU加速带给传统算法的项目，并且提供了与Pandas和scikit-learn一致的用法和体验，非常值得大家尝试。

2019/07/06 10:58:40 阅读 14794

GPU/机器学习/深度学习

数据科学的Python——keras备忘录发布，含Keras的各种使用样例

2019/07/02 22:14:46 阅读 2538

keras/深度学习

标签平滑（Label Smoothing）——分类问题中错误标注的一种解决方法

在2016年，Szegedy等人提出了inception v2的模型（论文：Rethinking the inception architecture for computer vision.）。其中提到了Label Smoothing技术，可以提高模型效果。

2019/06/25 17:27:24 阅读 12278

深度学习

使用卷积神经网络进行手写识别

本文是发在Medium上的一篇博客：《Handwritten Equation Solver using Convolutional Neural Network》。本文是原文的翻译。这篇文章主要教大家如何使用keras训练手写字符的识别，并保存训练好的模型到本地，以及未来如何调用保存到模型来预测。

2019/06/23 22:35:53 阅读 3506

卷积神经网络/深度学习

Tensorflow中数据集的使用方法（tf.data.Dataset）

Tensorflow中tf.data.Dataset是最常用的数据集类，我们也使用这个类做转换数据、迭代数据等操作。本篇博客将简要描述这个类的使用方法。

2019/06/22 16:04:24 阅读 13832

python/tensorflow/编程

CNN中的一些高级技术（空洞卷积/显著图/反卷积）

卷积神经网络是图像识别领域最重要的深度学习技术。也可以说是是本轮深度学习浪潮开始点。本文总结了CNN的三种高级技巧，分别是空洞卷积、显著图和反卷积技术。

2019/06/22 15:28:01 阅读 11068

卷积神经网络/深度学习

一文看懂如何初始化神经网络

深度学习的初始化非常重要，这篇博客主要描述两种初始化方法：一个是Kaiming初始化，一个是LSUV方法。文中对比了不同初始化的效果，并将每一种初始化得到的激活函数的输出都展示出来以查看每种初始化对层的输出的影响。当然，作者最后也发现如果使用了BatchNorm的话，不同的初始化方法结果差不多。说明使用BN可以使得初始化不那么敏感了。

2019/06/21 17:20:49 阅读 6376

深度学习/神经网络

提炼BERT——将BERT转成小模型（Distilling BERT — How to achieve BERT performance using Logistic Regression）

BERT是很好的模型，但是它的参数太大，网络结构太复杂。在很多没有GPU的环境下都无法部署。本文讲的是如何利用BERT构造更好的小的逻辑回归模型来代替原始BERT模型，可以放入生产环境中，以节约资源。

2019/06/20 11:57:47 阅读 4130

BERT/深度学习

2012年发表的AlexNet可以算是开启本轮深度学习浪潮的开山之作了。由于AlexNet在ImageNet LSVRC-2012（Large Scale Visual Recognition Competition）赢得第一名，并且错误率只有15.3%（第二名是26.2%），引起了巨大的反响。相比较之前的深度学习网络结构，AlexNet主要的变化在于激活函数采用了Relu、使用Dropout代替正则降低过拟合等。本篇博客将根据其论文，详细讲述AlexNet的网络结构及其特点。

2019/06/20 10:28:16 阅读 9139

卷积神经网络/深度学习

AdaBoost算法详解以及代码实现

AdaBoost，全称是“Adaptive Boosting”，由Freund和Schapire在1995年首次提出，并在1996发布了一篇新的论文证明其在实际数据集中的效果。这篇博客主要解释AdaBoost的算法详情以及实现。它可以理解为是首个“boosting”方式的集成算法。是一个关注二分类的集成算法。

2019/06/15 09:09:13 阅读 10611

adaboost/集成学习

深度学习的反向传播手动推导

反向传播算法是深度学习求解最重要的方法。这里我们手动推导一下。

2019/06/04 11:37:14 阅读 4007

反向传播/梯度下降/深度学习

深度学习的经典算法的论文、解读和代码实现

深度学习是目前最火的算法领域。他在诸多任务中取得的骄人成绩使得其进化越来越好。本文收集深度学习中的经典算法，以及相关的解释和代码实现。

2019/06/03 11:36:41 阅读 15687

深度学习

深度学习卷积操作的维度计算（PyTorch/Tensorflow等框架中Conv1d、Conv2d和Conv3d介绍）

卷积操作的维度计算是定义神经网络结构的重要问题，在使用如PyTorch、Tensorflow等深度学习框架搭建神经网络的时候，对每一层输入的维度和输出的维度都必须计算准确，否则容易出错，这里将详细说明相关的维度计算。

2019/05/31 20:27:07 阅读 19819

PyTorch/卷积神经网络/深度学习

CNN经典算法之Inception V1（GoogLeNet）

GoogLeNet是谷歌在2014年提出的一种CNN深度学习方法，它赢得了2014年ILSVRC的冠军，其错误率要低于当时的VGGNet。与之前的深度学习网络思路不同，之前的CNN网络的主要目标还是加深网络的深度，而GoogLeNet则提出了一种新的结构，称之为inception。GoogLeNet利用inception结构组成了一个22层的巨大的网络，但是其参数却比之前的如AlexNet网络低很多。是一种非常优秀的CNN结构。

2019/05/31 20:22:25 阅读 4926

GoogLeNet/Inception/卷积神经网络/深度学习

CNN经典算法VGGNet介绍

VGGNet（Visual Geometry Group）是2014年又一个经典的卷积神经网络。VGGNet最主要的目标是试图回答“如何设计网络结构”的问题。随着AlexNet提出，很多人开始利用卷积神经网络来解决图像识别的问题。一般的做法都是重复几层卷积网络，每个卷积网络之后接一些池化层，最后再加上几个全连接层。而VGGNet的提出，给这些结构设计带来了一些标准参考。

2019/05/28 21:05:44 阅读 7948

卷积神经网络/深度学习

CNN入门算法LeNet-5介绍（论文详细解读）

1998年，LeCun提出了LeNet-5网络用来解决手写识别的问题。LeNet-5被誉为是卷积神经网络的“Hello Word”，足以见到这篇论文的重要性。在此之前，LeCun最早在1989年提出了LeNet-1，并在接下来的几年中继续探索，陆续提出了LeNet-4、Boosted LeNet-4等。本篇博客将详解LeCun的这篇论文，并不是完全翻译，而是总结每一部分的精华内容。

2019/05/26 22:21:20 阅读 15724

卷积神经网络/深度学习

Keras框架下输出模型中间层学习到的表示的两种常用方式

深度学习本质上是表示学习，它通过多层非线性神经网络模型从底层特征中学习出对具体任务而言更有效的高级抽象特征。针对一个具体的任务，我们往往会遇到这种情况：需要用一个模型学习出特征表示，然后将学习出的特征表示作为另一个模型的输入。这就要求我们会获取模型中间层的输出，下面以具体代码形式介绍两种具体方法。

2019/04/10 20:26:10 阅读 3159

Keras/中间层表示

中文停用词表和英文停用词表

2019/03/27 21:21:03 阅读 6162

中文停用词表和英文停用词表

端到端（end-to-end）学习

2019/03/27 21:20:37 阅读 3275

端到端（end-to-end）学习

模型中的参数和超参数

2019/03/27 21:20:13 阅读 3166

模型中的参数和超参数

Keras框架下的保存模型和加载模型

2019/03/27 21:19:46 阅读 3086

Keras框架下的保存模型和加载模型

Keras中predict()方法和predict_classes()方法的区别

2019/03/27 21:19:21 阅读 7370

Keras中predict()方法和predict_classes()方法的区别

人工智能与大模型最新资讯与技术博客

100天搞定机器学习（100-Days-Of-ML）（一）数据预处理

基于GPU的机器学习Python库——RAPIDS简介及其使用方法

数据科学的Python——keras备忘录发布，含Keras的各种使用样例

神器！AI硬件基准测试库发布

标签平滑（Label Smoothing）——分类问题中错误标注的一种解决方法

使用卷积神经网络进行手写识别

Tensorflow中数据集的使用方法（tf.data.Dataset）

CNN中的一些高级技术（空洞卷积/显著图/反卷积）

一文看懂如何初始化神经网络

提炼BERT——将BERT转成小模型（Distilling BERT — How to achieve BERT performance using Logistic Regression）

CNN经典算法AlexNet介绍

AdaBoost算法详解以及代码实现

深度学习的反向传播手动推导

深度学习的经典算法的论文、解读和代码实现

深度学习卷积操作的维度计算（PyTorch/Tensorflow等框架中Conv1d、Conv2d和Conv3d介绍）

CNN经典算法之Inception V1（GoogLeNet）

CNN经典算法VGGNet介绍

CNN入门算法LeNet-5介绍（论文详细解读）

Keras框架下输出模型中间层学习到的表示的两种常用方式

中文停用词表和英文停用词表

端到端（end-to-end）学习

模型中的参数和超参数

Keras框架下的保存模型和加载模型

Keras中predict()方法和predict_classes()方法的区别

最新博客