Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

苹果刚刚发布了一个全新的机器学习矿机MLX，这是一个类似NumPy数组的框架，目的是可以在苹果的芯片上更加高效地运行各种机器学习模型，当然最主要的目的是大模型。

2023/12/06 22:05:252,961

#MLX #统一内存架构

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

为了提高AI模型的推理速度，降低在不同GPU硬件部署的成本，Meta AI研究人员在昨天发布了一个全新的AI推理引擎AITemplate（AIT），该引擎是一个Python框架，它在各种广泛使用的人工智能模型（如卷积神经网络、变换器和扩散器）上提供接近硬件原生的Tensor Core（英伟达GPU）和Matrix Core（AMD GPU）性能。

2022/10/04 13:28:272,969

#AITemplate #AI推理速度

2023年9月份各大企业拥有的A100的GPU显卡数量

在高性能计算（HPC）、人工智能（AI）、和数据分析等领域，图形处理器（GPUs）正在发挥越来越重要的作用。其中，NVIDIA的 A100尤为引人注目。这是英伟达最强大的显卡处理器，也是当前使用最广泛大模型训练用的显卡。本文主要是各大企业最新的2023年9月份拥有的显卡数量统计。

2023/09/16 14:08:582,970

#A100 #显卡

HttpClient的使用方法案例

HttpClient的使用方法案例爬虫

2016-04-06 21:32:332,976

#Java #网络爬虫

Stable Diffusion2.1发布！

刚刚，StabilityAI宣布Stable Diffusion2.1发布。距离Stable Diffusion2.0大版本发布刚2个星期，2.1版本就发布了，2.1版本有诸多改进功能。

2022/12/08 00:33:512,988

#StabilityAI #StableDiffusion

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

Llama3是MetaAI开源的最新一代大语言模型。一发布就引起了全球AI大模型领域的广泛关注。这是MetaAI开源的第三代大语言模型，也是当前最强的开源模型。但相比较第一代和第二代的Llama模型，Llama3的升级之处有哪些？本文以图表的方式总结Llama3的升级之处。

2024/04/21 20:31:563,020

#Llama3-400B #Llama3-70B

网络爬虫原理

网络爬虫指按照一定的规则（模拟人工登录网页的方式），自动抓取网络上的程序。

2016-09-08 22:03:063,026

#java #网络爬虫

常见的正则表达式写法总结

正则表达式非常有用，非常强大，但也并不容易写，在这里我们总结一些常用的正则表达式写法

2017/11/18 09:20:503,028

#java #正则表达式

Batch Normalization应该在激活函数之前使用还是激活函数之后使用？

Batch Normalization（BN）是深度学习领域最重要的技巧之一，最早由Google的研究人员提出。这个技术可以大大提高深度学习网络的收敛速度。简单来说，BN就是将每一层网络进行归一化，就可以提高整个网络的训练速度，并打乱训练数据，提升精度。但是，BN的使用可以在很多地方，很多人最大的困惑是放在激活函数之前还是激活函数之后使用，著名机器学习领域的博主Santiago总结了这部分需要注意的内容。

2022/11/05 14:42:333,028

#BatchNormalization #深度学习

网络爬虫之httpclient的使用

2016-09-08 22:11:343,035

#httpclient #Java

是否需要使用NumPy代替Pandas处理数据以提高性能？

Pandas和NumPy是Python数据科学领域中最基础的两个库，他们都可以读取大量的数据并对数据做计算等处理。有很多的操作他们都能做。那么，这两个Python库在数据处理的性能上有什么差别呢？今天在Reddit上看到一个有意思的讨论和大家分享一下。

2021/12/11 19:50:593,038

#numpy #pandas

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

腾讯AI Lab去年四月成立，今年是首次参加ICML，共计四篇文章被录取，位居国内企业前列。此次团队由机器学习和大数据领域的专家、腾讯AI Lab主任张潼博士带领到场交流学习，张潼博士还担任了本届ICML领域主席。在本次130人的主席团队中，华人不超过10位，内地仅有腾讯AI Lab、清华大学和微软研究院三家机构。

2017/11/04 09:36:193,045

#学术 #科研

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

2018/03/07 20:24:133,060

#词向量

全球最大10个的SaaS企业简介

现代软件企业中，SaaS服务提供商是最值得注意的企业。因为SaaS行业规模大利润高，也是最有前景的一类企业。但是，国内市场因为很多因素导致SaaS的规模和空间都比较低。本文梳理一下全球最大的10个SaaS服务提供商，供大家参考。

2021/12/08 22:58:163,060

#云计算 #创业企业

康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架：LLMTune

Cornell Tech开源了LLMTune，这是一个可以在消费级显卡上微调大模型的框架，经过测试，可以在48G显存的显卡上微调4bit的650亿参数的LLaMA模型！

2023/05/14 23:42:573,063

#PEFT #大模型微调

《Effective Java 第三版》笔记之七消除过期的对象引用

本文是Effective Java第三版笔记的第七个之消除过期的对象引用，Item 7: Eliminate obsolete object references

2018/09/28 15:44:233,067

#effectivejava #java

华为大模型生态重要一步！PyTorch最新2.1版本宣布支持华为昇腾芯片（HUAWEI Ascend）

大模型的发展一个重要的基础条件是底层硬件计算能力的大幅提高，特别是GPU的发展，与transformer架构的大模型训练非常契合。当前全球最大的GPU供应商英伟达系列的显卡几乎垄断了大模型训练与推理的所有GPU芯片市场。除了英伟达显卡本身算力强悍外，基于英伟达GPU之上构建的CUDA、PyTorch等平台软件生态也是非常重要的一环。而最新的PyTorch2.1版本发布的一个beta特性中包含了对华为昇腾芯片的原生支持，这也是大模型生态多样性发展的一个很重要的信号。

2023/10/09 11:45:033,071

#NPU #PyTorch

如何用7.7亿参数的蒸馏模型超过5400亿的大语言模型——Google提出新的模型蒸馏方法：逐步蒸馏（Distilling step-by-step）详解

华盛顿大学研究人员与Google的研究人员一起在5月3日公布了一个新的方法，即逐步蒸馏（Distilling step-by-step），这个方法最大的特点有2个：一是需要更少的数据来做模型的蒸馏（根据论文描述，平均只需要之前方法的一半数据，最多只需要15%的数据就可以达到类似的效果）；而是可以获得更小规模的模型（最多可以比原来模型规模小2000倍！）

2023/05/05 22:03:053,077

#模型蒸馏

dask的dataframe的值变成1和foo的解决方法

2020/05/08 14:30:533,082

#dask #python

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

3月29日，DeepMind发表了一篇论文，"Training Compute-Optimal Large Language Models"，表明基本上每个人--OpenAI、DeepMind、微软等--都在用极不理想的计算方式训练大型语言模型。论文认为这些模型对计算的使用一直处于非常不理想的状态。并提出了新的模型缩放规律。

2022/04/04 13:14:093,118

#deepmind #论文快讯

一个基于Python的机器学习项目——各种Kaggle比赛的解决方案

2019/11/03 12:02:163,120

Original AI Tech Blogs

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

2023年9月份各大企业拥有的A100的GPU显卡数量

HttpClient的使用方法案例

Stable Diffusion2.1发布！

块级元素和行内元素以及转换

LFDMM源码剖析(融入词向量的概率图模型)

Jsoup使用演示

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

网络爬虫原理

常见的正则表达式写法总结

Batch Normalization应该在激活函数之前使用还是激活函数之后使用？

网络爬虫之httpclient的使用

是否需要使用NumPy代替Pandas处理数据以提高性能？

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

全球最大10个的SaaS企业简介

康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架：LLMTune

《Effective Java 第三版》笔记之七消除过期的对象引用

华为大模型生态重要一步！PyTorch最新2.1版本宣布支持华为昇腾芯片（HUAWEI Ascend）

如何用7.7亿参数的蒸馏模型超过5400亿的大语言模型——Google提出新的模型蒸馏方法：逐步蒸馏（Distilling step-by-step）详解

dask的dataframe的值变成1和foo的解决方法

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

一个基于Python的机器学习项目——各种Kaggle比赛的解决方案

重磅！苹果官方发布大模型框架：一个可以充分利用苹果统一内存的新的大模型框架MLX，你的MacBook可以一键运行LLaMA了

12倍推理速度提升！Meta AI开源全新的AI推理引擎AITemplate

2023年9月份各大企业拥有的A100的GPU显卡数量

HttpClient的使用方法案例

Stable Diffusion2.1发布！

块级元素和行内元素以及转换

LFDMM源码剖析(融入词向量的概率图模型)

Jsoup使用演示

Llama3相比较前两代的模型（Llama1和Llama2）有哪些升级？几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况

网络爬虫原理

常见的正则表达式写法总结

Batch Normalization应该在激活函数之前使用还是激活函数之后使用？

网络爬虫之httpclient的使用

是否需要使用NumPy代替Pandas处理数据以提高性能？

【转载】全面解读ICML 2017五大研究热点 | 腾讯AI Lab独家解析

主题模型结合词向量模型(Improving Topic Models with Latent Feature Word Representations)

全球最大10个的SaaS企业简介

康奈尔大学发布可以在一张消费级显卡上微调650亿参数规模大模型的框架：LLMTune

《Effective Java 第三版》笔记之七 消除过期的对象引用

华为大模型生态重要一步！PyTorch最新2.1版本宣布支持华为昇腾芯片（HUAWEI Ascend）

如何用7.7亿参数的蒸馏模型超过5400亿的大语言模型——Google提出新的模型蒸馏方法：逐步蒸馏（Distilling step-by-step）详解

dask的dataframe的值变成1和foo的解决方法

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

一个基于Python的机器学习项目——各种Kaggle比赛的解决方案

《Effective Java 第三版》笔记之七消除过期的对象引用