用户 小木 的博客
聚焦人工智能、大模型与深度学习的精选内容,涵盖技术解析、行业洞察和实践经验,帮助你快速掌握值得关注的AI资讯。
最新博客
神经网络发展简介
看过很多书,都说了神经网络的进展,但总有一些小问题没有明白。这次基本上都明白了,记录一下。
2018年7月份以来最好的机器学习的Github库和Reddit帖子
这是来自AnalyticsVidhya的Pranav Dar的帖子
《Effective Java 第三版》笔记之二 当构造参数很多的时候考虑使用builder
本文是Effective Java第三版笔记的第二个之当构造参数很多的时候考虑使用builder
《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器
本文是Effective Java第三版笔记的第一个之创建静态工厂方法而不是使用构造器
MySQL启用中文全文检索功能
MySQL支持对文本进行全文检索,全文检索可以类似搜索引擎的功能,相比较模糊匹配更加灵活高效且更快。MySQL5.7之后也支持对中文的全文检索,这里描述如何启用MySQL的中文全文检索。
JetBrains的IDEA打包可执行Jar文件以及maven的依赖的方法
使用idea打包jar文件的方法
Git的简介和使用
Git是一个版本控制系统,用来追踪计算机文件的变化的工具,也是一个供多人使用的协同工具。它是一个分布式的版本控制系统,本文将简单介绍如何使用。
如何理解狄利克雷过程(Dirichlet Process)
狄利克雷过程是非参贝叶斯推断的基础模型。本博客将简要介绍狄利克雷过程模型
论文中常见的英语表达
英语论文常见表达笔记
多项式分布的贝叶斯推断
多项式分布是非常常见的分布,他是二项分布在多维上的推广。例如掷骰子结果中,1-6点出现的次数就是一个多项式分布。多项式分布在如主题建模中非常常见,本文将讲述多项式分布的贝叶斯推导过程。
高斯混合模型(GMM)
高斯混合模型是一个参数概率密度函数,它是一组高斯密度函数的加权求和。在生物统计领域,高斯混合模型通常是连续测度或者特征的概率分布的参数模型。高斯混合模型可以使用迭代的EM算法或者最大后验概率法估计参数。
文本预处理的一般步骤和方法
文本预处理是一件极其耗费时间的事情,不仅繁琐而且涉及的细节很多,处理不好对后面的事情的影响很大。本文将简要介绍文本预处理的一般步骤和方法。
常见的正则表达式写法总结
正则表达式非常有用,非常强大,但也并不容易写,在这里我们总结一些常用的正则表达式写法
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
Dirichlet过程是一个随机过程,在非参数贝叶斯模型中有广泛运用,最常见的应用是Dirichlet过程混合模型
Eclipse使用Maven插件的简单介绍
使用Maven作为构建工具,管理项目和依赖非常方便。这篇博客将简要介绍在Eclipse中如何使用Maven插件
Java爬虫入门简介(一) —— HttpClient请求
使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。
Java爬虫入门简介(三) —— Jsoup解析HTML页面
使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。在这篇博客里,我们将简单介绍Jsoup解析HTML页面的操作。
Java爬虫入门简介(二) —— HttpClient详细使用方法
使用爬虫获取数据对科研来说及其重要,本系列博客将讲述如何使用Java编写爬虫工具获取网页数据。包括HttpClient 4.3及以上版本的Header设置,请求参数设置等。
Android开发入门基础
Android是基于Linux的修改版本的移动操作系统。 大多数Android代码是在开源Apache许可证下发布的。本文将简单介绍Android开发入门知识。
Android开发入门基础知识——Intent详解
Intent是Android中通信的组件。这篇博客将详细讲述什么是Intent及其用法。
贝塔分布(Beta Distribution)简介及其应用
贝塔分布(Beta Distribution)是一个连续的概率分布,它只有两个参数。它最重要的应用是为某项实验的成功概率建模。在本篇博客中,我们使用Beta分布作为描述。
Java爬虫入门简介(四)——HttpClient保存使用Cookie登录
在使用HttpClient作为客户端请求数据的时候,我们常常需要以一个用户的身份多次请求一个网站内的多种资源。例如,我一次登录后,后面希望以这个身份继续访问不用重新登录。这里就可以使用cookie了。