统计、机器学习与编程知识的原创博客

Git提交本地文件

Git操作记录

2020/03/20 09:33:30 阅读 1957

git/svn/编程

好东西！Transformer入门神作手把手按行实现Transformer教程The Annotated Transformer2022版本来袭

The Annotated Transfomer是哈佛大学的研究人员于2018年发布的Transformer新手入门教程。这个教程从最基础的理论开始，手把手教你按照最简单的python代码实现Transformer，一经推出就广受好评。2022年，这个入门教程有了新的版本。

2022/11/05 20:02:14 阅读 1957

transformer/教程

Python包中init.py文件的作用和用法

在Python工程中，我们经常可以看到带有“\_\_init\_\_.py”文件的目录，在PyCharm中，带有这个文件的目录被认为是Python的包目录，与目录的图标有不一样的显示。那么这个文件的作用是什么，我们平时如何使用呢，这篇文章将解释这个问题。

2021/10/16 21:42:55 阅读 1941

python/编程

关于OpenAI最新的营收和成本数据估算：包括ChatGPT Plus付费用户数以及OpenAI的月度成本等

今天， Analytics India Magazine披露了说ChatGPT每天的运行成本70万美元左右，以及七月份ChatGPT月活人数也环比上月降低2亿，只剩15亿用户左右。而硅谷著名风投A16Z（Andreessen Horowitz）也透露了一些OpenAI的数据我们可以一起看看。

2023/08/14 20:25:08 阅读 1938

ChatGPT/OpenAI

超越所有开源编程大模型和GPT-3.5！华为发布150亿参数规模的编程大模型PanGu-Coder2

华为盘古大模型一直是国内大模型领域比较早的先行者，不过由于该模型并不针对个人开放，因此很少有人可以体验到该模型的效果。但是，盘古大模型一直在不断发展。2023年7月27日，华为发布最新的论文，展示了新一代盘古大模型的编程能力。该模型名字为PanGu-Coder2，论文的数据显示该模型目前超越所有开源编程大模型的效果，也超过GPT-3.5，接近GPT-4。

2023/07/29 00:02:54 阅读 1932

盘古大模型/编程大模型

OpenAI可能即将增加按年付费的选项，一年的ChatGPT Plus仅需200美元

在1月8日的ChatGPT网站的接口中，有人发现OpenAI增加了按年订阅的选项。接口返回的信息表示，ChatGPT的按年付费200美元即可，折算之后每个月大约16.66美元，一年立省40美元~

2024/01/09 16:21:58 阅读 1919

ChatGPT/ChatGPTPlus/ChatGPT付费

5月3日，2个重磅开源的AI模型发布：Replit代码补全大模型和LLaMA复刻版OpenLLaMA发布

五一长假最后一天，AI技术的发展依然火热。今天有2个重磅的开源模型发布：一个是前几天提到的Replit的代码补全大模型Replit Code V1 3B，一个是UC Berkeley的博士生Hao Liu发起的一个开源LLaMA复刻项目。

2023/05/03 21:40:58 阅读 1915

AI模型/代码补全/开源模型

总结一下截止2023年中旬全球主要厂商拥有的GPU数量以及训练GPT-3/LLaMA2所需要的GPU数量

GPU Utils最近总结了一个关于英伟达H100显卡在AI训练中的应用文章。里面透露总结了一些当前的主流厂商拥有的显卡数量以及一些模型训练所需的显卡数。文章主要描述的是H1000的供应与需求，也包含H100的性能描述，本文主要总结一下里面提到的显卡数相关统计供大家参考。

2023/08/04 11:11:48 阅读 1914

GPU/显卡数量

语音模型的GPT时刻：MetaAI发布的基础语音大模型Voicebox简介及其模型说明

今天，MetaAI发布了一个新的语音处理领域的生成式大模型Voicebox，可以像GPT那样用生成式的方式处理语音（speech）数据的相关任务，包括语音编辑、跨风格语音生成等语音数据处理相关的很多任务。这可能就是语音处理领域的GPT时刻！

2023/06/17 21:27:04 阅读 1898

生成式模型/语音模型/音频大模型

C/C++源代码是如何被最终执行的？

C/C++的源程序文件都是程序员按照相关语法和规则编写的。但是这样的程序文件并不能直接被硬件识别和执行。本文将简要描述C/C++的源代码是如何经过转化并最终转变成可以被硬件识别执行的二进制文件的。

2021/09/26 20:48:02 阅读 1894

C语言/编程

如何提高大语言模型作为Agent的能力？清华大学与智谱AI推出AgentTuning方案

尽管开源的大语言模型发展非常迅速，但是，在以大语言模型作为核心的新一代AI Agent解决方案上，开源大语言模型比商业模型表现要明显地差。为了提高大语言模型作为AI Agent的表现和能力，清华大学和智谱AI推出了一种新的方案，AgentTuning，可以将有效增强开源大语言模型作为AI Agent的能力。

2023/10/24 20:33:26 阅读 1884

AgentTuning/AIAgent/智能体

2022年必读的AI论文——100个AI领域被引最多的论文分析

尽管AI领域在工业界发展迅速，企业研究机构在拼命的开发相关的产品以推动各自业务的发展。但是他们也在科研领域不断贡献大量的AI论文。Zeta Alpha的一篇博客分析了2022年发表的被引用最多的100篇AI论文，给大家提供一个洞察思路。

2023/03/04 23:36:34 阅读 1870

AI/论文

国产开源大模型再添重要玩家：BAAI发布开源可商用大模型Aquila

BAAI全称北京智源人工智能研究院（Beijing Academy of Artificial Intelligence），是国内非常重要的一个人工智能研究机构。此前发布了悟道系列数据集和大模型。在最近，他们开源了一个全新的国产开源大语言模型Aquila系列模型。该模型基于大量的中英文数据集训练，是一个完全开源可商用国产大语言模型。

2023/06/13 08:25:14 阅读 1860

Aquila/国产大模型/大模型

一个非常有趣的数据工程师小游戏

Firebolt开发了一个数据工程师的网页小游戏，带你体验数据分析的全流程。游戏里你扮演一个数据工程师，从数据收集开始，经历数据pipeline、数据入数据湖以及数据分析等，最终形成各种图表的结果。

2022/03/29 10:02:56 阅读 1856

好物推荐

Deep Neural Networks and Tabular Data: A Survey——XGBoost依然是最优秀的算法模型

异质表格数据是最常用的数据形式，对于众多关键和计算要求高的应用来说是必不可少的。在同质数据集上，深度神经网络已多次显示出优异的性能，因此被广泛采用。然而，它们在表格数据建模（推理或生成）方面的应用仍然具有高度挑战性。

2022/03/31 12:15:19 阅读 1849

论文快讯

Python3.10版本的结构模式匹配（structural pattern matching）简介

Python最新正式版本3.10在10月4日已经发布。这个版本从2020年5月开始开发，经历差不多一年半的时间终于正式发布。当然每一个新版本都有很多新功能。我们将持续关注新功能，在这篇文章中，我们将简述3.10中新功能中的语法——结构模式匹配（structural pattern matching）。

2021/10/14 22:45:20 阅读 1846

python/structuralpatternmatching/结构模式匹配

AI2发布全新的大语言模型预训练数据集：包含3万亿tokens的大规模文本数据集AI2 Dolma，开源免费商用数据集~

Allen Institute for AI简称AI2，是2014年成立的一个非营利性研究组织，其创办者是之前的微软联合创始人Paul G. Allen。目前该组织主导了几个非常大的项目，希望借助AI来推动科学、医学等领域的进步。此前也开源过大模型OLMo等。这次是该组织第一份发布AI数据集相关的项目，名称位Dolma，是一个包含了3万亿tokens的数据集，目前第一版本仅仅包含英文。

2023/08/21 21:49:30 阅读 1827

Dolma/开源数据集/数据集/预训练数据集

强大的对象分割开源算法！Meta AI开源Segment Anything: Working（SAM）预训练大模型！

SAM全称是Segment Anything Model，由MetaAI最新发布的一个图像分割领域的预训练模型。该模型十分强大，并且有类似GPT那种基于Prompt的工作能力，在图像分割任务上展示了强大的能力！此外，该模型从数据集到训练代码和预训练结果完全开源！真Open的AI！

2023/04/24 22:43:01 阅读 1823

MetaAI/图像分割/预训练模型

好消息！吴恩达再发大模型精品课程：Generative AI with Large Language Models，一个面向中级人员的生成式AI课程

吴恩达创办的DeepLearning.AI一直在提供各种面向AI领域的精品课程。在上个月，他们发布的四门AI短课程（包含了ChatGPT的使用、ChatGPT Prompt工程技术、面向LLM应用的LangChain教程和Diffusion工作原理）受到了广泛的欢迎。今天，吴恩达宣布与AWS的研究人员一起推出了全新的长课程《Generative AI with Large Language Models》，这门课程的主要内容是讲授生成式AI的工作原理以及如何部署面向真实世界应用的生成式AI模型。

2023/06/29 23:32:22 阅读 1822

AI教程/吴恩达/生成式AI课程

div和span的区别

2018/09/30 21:41:46 阅读 1806

div/span