人工智能与大模型最新资讯与技术博客

Saleforce发布最新的开源语言-视觉处理深度学习库LAVIS

Salesforce的研究人员开发了LAVIS（LAnguage-VISION的缩写），这是一个开源的库，用于在丰富的常见任务和数据集系列上训练和评估最先进的语言-视觉模型，并用于在定制的语言-视觉数据上进行现成的推理。

2022/09/25 08:25:06 阅读 2817

数据集/深度学习/计算机视觉/语言-视觉

Google发布面试辅助工具Interview Warmup帮助我们理解谷歌面试内容

最近，谷歌发布了一项新的工具：Google Interview Warmup，让你练习回答由行业专家选定的问题，并使用机器学习来转录你的答案，帮助你发现改进面试的回答。

2022/09/24 21:36:33 阅读 2176

谷歌/面试

强化学习进入分布式时代——DeepMind分布式强化学习框架ACME发布

深度强化学习（RL）导致了许多最近的和突破性的进展。然而，强化学习的实施并不容易，与使深度学习拥有PyTorch这样简单的框架支持不同，强化学习的训练缺少强有力的工具支撑。为了解决这些问题，DeepMind发布了Acme，一个用于构建新的RL算法的框架，该框架是专门为实现代理而设计的

2022/09/24 20:58:03 阅读 1441

acme/DeepMind/强化学习

谷歌官方高性能大规模高维数据处理库TensorStore发布！

今天Google发布了TensorStore，这是一个开源的C++和Python软件库，设计用于存储和操作大规模n维数据。TensorStore已经被用来解决科学计算中的关键工程挑战（例如，管理和处理神经科学中的大型数据集，如石油级的三维电子显微镜数据和神经元活动的 "4d "视频）。TensorStore还被用于创建大规模的机器学习模型，如PaLM，解决了分布式训练期间管理模型参数（检查点）的问题。

2022/09/24 10:15:50 阅读 1434

Tensorflow/TensorStore/好物分享/高维数据

Stable Diffusion的Tensorflow/Keras实现及使用

最近一段时间Text-to-Image模型十分火热。OpenAI的DALL·E2模型的效果十分惊艳。不过，由于Open AI现在的不Open策略，大家还无法使用这个模型，业界只开放了一个小版本的DALL·E mini。不过，前段时间，Stability AI发布的Stable Diffusion其效果明显好于现有模型，且免费开放使用，让大家都开心了一把。不过原有模型是Torch实现的，而现在，基于Tensorflow/Keras实现的Stable Diffusion已经开源。

2022/09/24 09:58:12 阅读 1544

keras/StableDiffusion/tensorflow/text-to-image

重磅数据集公布！LAION-400-Million Open Dataset免费的4亿条图像-文本对数据（ LAION-400M：English (image, text) pairs）

LAION全称Large-scale Artificial Intelligence Open Network，是一家非营利组织，成员来自世界各地，旨在向公众提供大规模机器学习模型、数据集和相关代码。他们声称自己是真正的Open AI，100%非盈利且100%Free。在九月份，他们公布了一个全新的图像-文本对（image-text pair）数据集。该数据集包含4亿条数据。

2022/09/14 11:14:02 阅读 7234

图像文本对/数据集/科研数据

重磅！Meta将PyTorch移交给Linux基金会！

昨天，Meta的Zuckerberg宣布，将PyTorch由Meta AI移交给Linux Foundation托管。这意味着PyTorch从今天起从Meta独立，并作为Linux Foundation下的一个项目。

2022/09/13 15:37:31 阅读 1148

pytorch/开源

强化学习的历史

强化学习（Reinforcement Learning）是近年来十分火热的一种机器学习研究领域。随着DeepMind（谷歌旗下的研究机构）的AlphaGo在围棋界战胜人类之后，这类方法开始被人们广泛关注。但是，强化学习并不是突然出现，也不是DeepMind的首创，在很久之前，这种方法已经开始发展，但是近年来，随着AI相关的软硬件能力的提升，强化学习的实用价值也开始显现。本文不涉及强化学习本身的技术细节，仅仅记录这种方法的历史由来。

2022/09/10 15:19:27 阅读 4037

强化学习

使用Let's Encrypt生成Tomcat使用的SSL证书并使用

随着安全隐私被大家所重视，网站开启HTTPS访问已经是不可阻挡的趋势。HTTPS协议就是借助SSL/TLS证书实现http的加密传输的协议（HTTP Over SSL/TLS）。本文将记录如何使用第三方库申请Let's Encrypt证书，并在tomcat中开启相关的功能。

2022/09/06 11:23:50 阅读 1654

https/tomcat/证书

MySQL8授权用户远程连接失败，提示ERROR 1410 (42000): You are not allowed to create a user with GRANT

原来直接用root账户授权远程访问失败，最新的MySQL8不允许直接创建并授权用户远程访问权限，必须先让自己有GRANT权限，然后创建用户，再授权。

2022/07/31 12:55:02 阅读 3150

mysql

TorchVision最新0.13版本发布！

PyTorch最新的1.12版本已经在前天发布。而其中TorchVision是基于PyTorch框架开发的面向CV解决方案的一个PyThon库，其最主要的特点是包含了很多流行的数据集、模型架构以及预训练模型等。本次也随着PyTorch1.12的发布更新到了v0.13。此次发布包含几个非常好的提升，值得大家关注。

2022/07/31 11:54:20 阅读 2195

cv/pytorch/torchvision/开源软件

谷歌提出最新的基于规则和机器学习混合的代码补全方法

我们将介绍如何将ML和SE结合起来，开发一种新的基于Transformer的混合语义ML代码补全，现在可供内部谷歌开发人员使用。我们讨论了如何通过（1）使用ML对SE单标记建议重新排序，（2）使用ML应用单行和多行补全并使用SE检查正确性，或（3）使用单标记语义建议的ML的单行和多行延拓来组合ML和SE。

2022/07/31 11:29:10 阅读 819

代码补全

斯坦福（Stanford）最新公开了全球第一个Transformers相关的课程！

重磅福利，斯坦福大学在去年秋季开设了应该是全球第一个transformers相关的课程，授课人员来自OpenAI、Google Brain、Facebook人工智能实验室、DeepMind甚至是牛津大学的业界与学术界的一线大牛。而这两天，这门课相关视频也都公开了，大家可以去观看学习了！

2022/07/11 23:56:01 阅读 1335

在线课程/深度学习课程

Python for Data Analysis第三版免费在线学习网站来临！

《Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter》是由Wes McKinney撰写的Python数据分析专业工具书籍。很容易理解，这本书就是教大家如何使用Pandas、NumPy以及Jupyter分析数据的。

2022/07/09 09:56:59 阅读 2353

python/编程书籍

深度学习模型训练将训练批次（batch）设置为2的指数是否有实际价值？

在深度学习训练中，由于数据太大，现在的训练一般是按照一个批次的数据进行训练。批次大小（batch size）的设置在很多论文或者教程中都提示要设置为$2^n$，例如16、32等，这样可能会在现有的硬件中获得更好的性能。但是，目前似乎没有人进行过实际的测试，例如32的batch size与33的batch size性能到底有多大差别？德国的Thomas Bierhance做了一系列实验，以验证批次大小设置为2的幂次方是不是真的可以加速。

2022/07/05 22:28:32 阅读 2725

深度学习/训练技术

指标函数（Metrics Function）和损失函数（Loss Function）的区别是什么？

指标（metrics）和损失函数（loss function）在深度学习和机器学习里面非常常见，很多时候他们的公式都似乎是一样的，在编写程序的时候，二者的区别好像也不是很大。那为什么还会有这两种不同的概念出现呢？本文将简单介绍一下二者的区别和应用。

2022/07/05 19:14:02 阅读 2947

指标函数/损失函数/深度学习

Python3.11最新特性来了，多个好特性提升！

上个月Python的3.11版本发布了第一个beta版本，3.11带来了很多非常棒的新特性，例如错误提示更加具体，可以定位到具体代码位置等，十分友好，建议大家关注。这里简单为大家介绍一下。

2022/07/02 18:11:46 阅读 1251

python

亚马逊近线性大规模模型训练加速库MiCS来了！

2022/06/29 19:55:06 阅读 1274

分布式训练/深度学习

不更改一行AI模型的代码加速你的模型训练过程——AI模型训练加速库Nebulgym简介

前几天初创AI企业Nebuly开源了一个AI加速库nebulgym，它最大的特点是不更改你现有AI模型的代码，但是可以将训练速度提升2倍。

2022/06/17 09:06:51 阅读 1235

AI训练/模型加速

简单几步教你如何在搭建并使用DALL·E开源版本来基于文字生成图片

大规模的text-to-image模型没有公开预训练结果，OpenAI的意思就是我这玩意太厉害，随便放出来可能会被你们做坏事，而谷歌训练这个应该就是为了云服务挣钱，所以都没有公开可用的版本供大家玩耍。虽然业界有基于论文的实现，但是训练模型需要耗费大量的资源，没有开放的预训练结果，我们普通个人也很难玩起来。但是，大神Sahar提供了一个免费使用开源实现的text-to-image预训练模型的方式。

2022/06/12 18:44:53 阅读 11381

Text-To-Image/图片生成/预训练模型

0基础基于Node.js创建第一个Vue的web项目

最近开始学习新的前端技术。以前开发网站直接使用jQuery+Bootstrap组合，感觉非常容易和方便。但是，现在前端貌似都开始转向基于构建的方式去开发。由于初学者进入一个项目看很多内容也不如上手启动一个项目感受好，本文抛弃原理，直接教大家上手创建一个vue项目。

2022/06/08 22:05:31 阅读 853

vue/前端构建

Hugging Face发布最新的深度学习模型评估库Evaluate！

就在儿童节前一天，Hugging Face发布了一个最新的深度学习模型评估库Evaluate。对于机器学习模型而言，评估是最重要的一个方面。但是Hugging Face认为当前模型评估方面非常分散且没有很好的文档。导致评估十分困难。因此，Hugging Face发布了这样一个Python的库，用以简化大家评估的步骤与时间。

2022/06/01 11:14:40 阅读 2251

huggingface/模型评价/深度学习