统计、机器学习与编程知识的原创博客

隐马尔科夫模型及其在NLP中的应用指南

隐马尔可夫模型（HMM）是一种统计模型，也用于机器学习。它可以用来描述取决于内部因素的可观察事件的演变，而这些因素是无法直接观察到的。这是一类概率图形模型，允许我们从一组观察到的变量中预测一串未知的变量。在这篇文章中，我们将详细讨论隐马尔可夫模型。我们将了解它可以使用的背景，我们也将讨论它的不同应用。我们还将讨论HMM在PoS标签中的使用和python的实现。文章中所涉及的主要内容如下。

2021/10/17 15:53:45 阅读 2927

HMM/机器学习/隐马尔科夫模型

基于java的网络爬虫框架(实现京东数据的爬取，并将插入数据库)

基于java的网络爬虫框架

2016-09-09 08:32:12 阅读 2923

java/网络爬虫

pandas的一些使用技巧

pandas的使用

2019/03/27 21:16:54 阅读 2922

pandas/Python

OpenAI第二代DALL·E发布，可以使用自然语言创造和编辑图片的模型

今天，时隔一年后，OpenAI发布了第二代的DALL·E模型。相比较第一代的模型，DALL·E 2，以4倍的分辨率生成更真实和准确的图像。

2022/04/06 23:25:38 阅读 2919

OpenAI/语言模型

Tensorflow和PyTorch是深度学习最流行的两个框架，二者都有坚定的支持者。一般认为由于Google的支持，TensorFlow的社区支持比较好，在工业应用广泛。但是尽管有keras加持，但易用性方面依然被认为不如PyTorch。而后者最早由Facebook人工智能团队开发。由于其易用性，被认为在科学研究中有广泛使用。那么，最近几年二者发展如何，是否实际还如之前的观点一样，这里AssemblyAI的一个作者做了一些对比。

2021/12/15 19:54:20 阅读 2916

pytorch/tensorflow

一个基于Python的机器学习项目——各种Kaggle比赛的解决方案

2019/11/03 12:02:16 阅读 2905

MySQL调优之SQL语句优化

SQL语句优化

2016-04-05 11:08:23 阅读 2895

mysqlsql语句

从阿里专家内部交流纪要看国内AI模型发展现状

本文主要描述了阿里眼中国内各家企业的大模型水平以及一些硬件算力的判断，同时结合部分其它信息整理。里面涉及到当前国内各大企业模型水平判断（如百度文心一言、华为盘古等）以及算力储备信息。

2023/04/24 22:44:34 阅读 2873

大模型/显卡/算力

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

2018/03/07 20:24:13 阅读 2868

词向量

2023年4月业界发布的重要20多个AI模型总结：OpenAssistant、Segment Anything Model、StableLM、AudioGPT等

2022年11月底，OpenAI发布ChatGPT，2023年3月14日，GPT-4发布。这两个模型让全球感受到了AI的力量。而随着MetaAI开源著名的LLaMA，以及斯坦福大学提出Stanford Alpaca之后，业界开始有更多的AI模型发布。本文将对4月份发布的这些重要的模型做一个总结，并就其中部分重要的模型进行进一步介绍。

2023/05/17 20:32:40 阅读 2860

2023年4月份AI模型/AI模型月报

网络爬虫原理

网络爬虫指按照一定的规则（模拟人工登录网页的方式），自动抓取网络上的程序。

2016-09-08 22:03:06 阅读 2848

java/网络爬虫

dask的dataframe的值变成1和foo的解决方法

2020/05/08 14:30:53 阅读 2848

dask/python

为初学者、中级和有经验的开发者提供70多个python项目

为初学者、中级和有经验的开发者提供70多个python项目, 10000, 小木, PythonHub今天在推上给大家分享了一个非常棒的项目，就是这个为为初学者、中级和有经验的开发者提供70多个python项目。亲自动手实践一些项目可以增加我们的实际的编程技巧。每一次都做一点将会得到很多。很多人都在GitHub、Reddit或者是Quera上搜索过哪些项目可以让Python初学者、中级者增加经验的Python项目。这次它来了。

2021/06/14 20:13:13 阅读 2845

python/编程/项目

网络爬虫之httpclient的使用

2016-09-08 22:11:34 阅读 2839

httpclient/Java

《Effective Java 第三版》笔记之七消除过期的对象引用

本文是Effective Java第三版笔记的第七个之消除过期的对象引用，Item 7: Eliminate obsolete object references

2018/09/28 15:44:23 阅读 2825

effectivejava/java/编程

强烈推荐！清华大学100亿参数规模的免费商用授权大模型：CPM-Bee 10B

最近几个月，国产大语言模型进步十分迅速。不过，大多数企业发布的大模型均为商业产品，少数开源的LLM则有较高的商业授权费用或者商用限制。对于希望使用LLM能力的中小企业以及个人来说都不是很合适。本次给大家介绍的是目前国产开源领域里面一个十分优秀且具有潜力的大语言模型CPM-Bee 10B。该模型来自清华大学NLP实验室，参数规模100亿，最重要的是对个人和企业用户均提供免费商用授权，十分友好！

2023/06/28 23:33:08 阅读 2823

CPM-Bee/国产大模型/开源大模型

Saleforce发布最新的开源语言-视觉处理深度学习库LAVIS

Salesforce的研究人员开发了LAVIS（LAnguage-VISION的缩写），这是一个开源的库，用于在丰富的常见任务和数据集系列上训练和评估最先进的语言-视觉模型，并用于在定制的语言-视觉数据上进行现成的推理。

2022/09/25 08:25:06 阅读 2821

数据集/深度学习/计算机视觉/语言-视觉

LFDMM源码剖析(融入词向量的概率图模型)

源码

2018/03/27 14:48:37 阅读 2807

源码

常见的正则表达式写法总结

正则表达式非常有用，非常强大，但也并不容易写，在这里我们总结一些常用的正则表达式写法

2017/11/18 09:20:50 阅读 2797

java/正则表达式

不同参数规模大语言模型在不同微调方法下所需要的显存总结

大模型的微调是当前很多人都在做的事情。微调可以让大语言模型适应特定领域的任务，识别特定的指令等。但是大模型的微调需要的显存较高，而且比较难以估计。与推理不同，微调过程微调方法的选择以及输入序列的长度、批次大小都会影响微调显存的需求。本文根据LLaMA Factory的数据总结一下大模型微调的显存要求。

2023/12/22 22:12:58 阅读 2787

大模型微调/微调显存/推理显存/显存大小

块级元素和行内元素以及转换

2018/10/09 13:38:01 阅读 2782

块级元素和行内元素

全球最大10个的SaaS企业简介

现代软件企业中，SaaS服务提供商是最值得注意的企业。因为SaaS行业规模大利润高，也是最有前景的一类企业。但是，国内市场因为很多因素导致SaaS的规模和空间都比较低。本文梳理一下全球最大的10个SaaS服务提供商，供大家参考。

2021/12/08 22:58:16 阅读 2780

云计算/创业企业

强烈推荐斯坦福大学的深度学习示意图网站

CS 230 ― Deep Learning是斯坦福大学视觉实验室（Stanford Vision Lab）的Shervine Amidi老师开设的深度学习课程，他在课程网站上挂了一个关于深度学习示意图的网站，这里面包含了各种深度学习相关概念的示意图和动图，十分简单明了。

2022/04/20 23:19:19 阅读 2761

深度学习

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

腾讯AI Lab去年四月成立，今年是首次参加ICML，共计四篇文章被录取，位居国内企业前列。此次团队由机器学习和大数据领域的专家、腾讯AI Lab主任张潼博士带领到场交流学习，张潼博士还担任了本届ICML领域主席。在本次130人的主席团队中，华人不超过10位，内地仅有腾讯AI Lab、清华大学和微软研究院三家机构。

2017/11/04 09:36:19 阅读 2753

学术/科研/顶级会议

最新博客