最新AI大模型咨询与技术解读——来自DataLearnerAI

Unifying Language Learning Paradigms——谷歌的一个模型打天下

如今，自然语言处理的预训练模型被广泛运用在各个领域。各大企业和组织都在追求各种大型的预训练模型。但是当你问我们应该使用哪一个预训练模型来解决问题的时候，通常没有统一的答案，一般来说它取决于下游的任务，也就是说需要根据任务类型来选择模型。而谷歌认为这不是一个正确的方向，因此，本周，谷歌提出了一个新的NLP预训练模型框架——Unifying Language Learning Paradigms（简称UL2）来尝试使用一个模型解决多种任务。

2022/05/12 22:50:30 阅读 2513

#论文快讯##通用预训练模型#

Python编程环境搭建——小白起步教程！

Python作为目前最流行的编程语言，因为其易用性以及丰富的库成为很多人的工具。它不仅是程序员的编程语言，也是各行各业提升工作效率的工具。本篇博客作为一篇针对完全小白的python语言搭建环境，不会为python语言本身做介绍，完全只考虑搭建python编程环境，目的是让你动手在电脑上写下第一行python程序，并成功运行，为广大童鞋提供一个入门参考。

2022/05/06 21:43:20 阅读 1210

#python##教程#

开源版本的GPT-3来临！Meta发布OPT大语言模型！

关注深度学习或者NLP的童鞋应该都知道openAI的GPT-3模型，这是一个非常厉害的模型，在很多任务上都取得了极其出色的成绩。然而，OpenAI的有限开放政策让这个模型的应用被限定在很窄的范围内。甚至由于大陆不在OpenAI的API开放国家，大家几乎都无法使用和体验。而五一假期期间，FaceBook的研究人员Susan Zhang等人发布了一个开源的大预言模型，其参数规模1750亿，与GPT-3几乎一样。

2022/05/05 23:00:56 阅读 5839

#NLP##深度学习#

超越Cross-Entropy Loss（交叉熵损失）的新损失函数——PolyLoss简介

Google旗下自动驾驶公司Waymo的研究人员Mingxing Tan发现了一个可以替代Cross-Entropy Loss的新的损失函数：PolyLoss，这是发表在ICLR 22的一篇新论文。什么都不变的情况下，只需要将损失函数的代码替换成PolyLoss，那么模型在图像分类、图像检测等任务的性能就会有很好的提升！

2022/05/03 17:31:30 阅读 2256

#损失函数##深度学习#

开源利器！一个文件实现完整的强化学习算法

很多算法的开源实现都包含多个文件，因此，学习这些开源代码的时候通常难以找到入口，也无法快速理解作者的逻辑，对于学习的童鞋来说都带来了不小的挑战。这里推荐一个非常优秀的强化学习开源库，它将经典的强化学习算法都实现在一个文件中，想要学习源代码的童鞋只需要看单个文件即可，这就是ClearRL!

2022/05/03 17:10:15 阅读 1625

#强化学习#

期刊审稿周期查询方法

科研成果发表速度对于国内的硕士生和博士生来说非常重要，它涉及了同学们的毕业、出国和奖学金等。很多童鞋在投稿之前都希望了解期刊的审稿周期。虽然大多数期刊没有规定明确的审稿时间，但是，随着大家对学术期刊投稿周期的关注，很多学术期刊也开始就自己的审稿速度开始有所要求，本文针对常见的期刊审稿周期提供一个普遍的分析方法。

2022/04/24 22:29:37 阅读 14835

#学术期刊#

全球主要开源组织概述

开源软件在现代互联网技术的发展中扮演者重要的作用。很多技术的进步和发展都是由开源软件推动的。而开源软件的发展离不开背后强大的开源组织的管理。本文列举最著名的五个开源组织，简述其背景，欢迎大家阅读。

2022/04/23 21:21:11 阅读 2669

#开源#

Bloomberg发布的最新的memray——Python内存分析器是什么？

Bloomberg在2022年4月开源了Memray，这是一个Python的内存分析器。它可以跟踪Python代码、本地扩展模块和Python解释器本身的内存分配情况。可以看numpy和pandas的运行内存使用。

2022/04/21 08:58:47 阅读 1537

#python##开源##性能提升#

强烈推荐斯坦福大学的深度学习示意图网站

CS 230 ― Deep Learning是斯坦福大学视觉实验室（Stanford Vision Lab）的Shervine Amidi老师开设的深度学习课程，他在课程网站上挂了一个关于深度学习示意图的网站，这里面包含了各种深度学习相关概念的示意图和动图，十分简单明了。

2022/04/20 23:19:19 阅读 2967

#深度学习#

DeepGraph Library（DGL）发布了0.81版本

2022/04/19 16:03:31 阅读 977

#GNN##图神经网络##好物推荐#

Pandas用法小册子

2022/04/19 09:50:27 阅读 980

##

JCR期刊中的ESCI是什么？它属于SCI索引吗？

很多童鞋在查询期刊的时候会发现某些期刊不是SCI（SCIE）索引，而是一个叫ESCI的索引。这似乎有点像SCI，但好像又有区别，所以大家会有疑问，本篇博客将解释二者的区别。

2022/04/18 19:41:09 阅读 13199

#ESCI##SCI##SCIE##学术##学术期刊#

SCI已经被SCIE替代

2020年1月13日，Clarivate官网发布声明称SCI索引将被去除。未来全部使用SCIE代替期刊索引。

2022/04/18 19:33:44 阅读 7020

#学术##学术期刊#

常用的SQL语句总结

平时很多时候需要用到SQL，一些常见常用的SQL语句总结，后面可以拷贝使用

2022/04/15 23:15:49 阅读 1043

#SQL##编程#

截至2022年4月份全球大语言模型一览图

Alan D Thompson博士总结的，截至2022年4月份全球大语言模型一览图。

2022/04/12 09:35:02 阅读 1458

#好物推荐#

正则化和数据增强对模型的影响并不总是好的：The Effects of Regularization and Data Augmentation are Class Dependent

正则化是一种基本技术，通过限制模型的复杂性来防止过度拟合并提高泛化性能。目前的深度网络严重依赖正则化器，如数据增强（DA）或权重衰减，并采用结构风险最小化，即交叉验证，以选择最佳的正则化超参数。然而，正则化和数据增强对模型的影响也不一定总是好的。来自Meta AI研究人员最新的论文发现，正则化是否有效与类别高度相关。

2022/04/11 22:52:18 阅读 1523

#论文快讯#

Python800页免费电子书——Python基本库和著名经典库的使用

《Python Notes For Professionals》是StackOverflow上的人总结的Python使用方法。

2022/04/11 15:55:55 阅读 1262

#python#

最近一段时间深度学习大模型的重要进展（2022年4月初）

今晚已经是本周的最后一天了，最近的一些深度学习算法方面的进展做个总结吧，感觉都是挺不错的，供大家参考。

2022/04/10 23:34:55 阅读 1522

#论文快讯#

使用Jupyter Notebook编程与python脚本编程的差异

Jupyter Notebook虽然在教学等领域有着非常大的优势，但是实际编程中，它的效率、可维护性等方面与python脚本相比的差距到底在哪也一直不那么清晰。就在上个月底，JetBrains的研究人员使用了大量的数据详细对比了二者的差异。这里总结一下其主要结论。

2022/04/10 22:40:35 阅读 2239

#Jupyter##编程##编程工具#

Python生态系统中5个NLP工具库

Python是目前最流行的编程语言，也是开放生态做得最好的编程语言之一。大多数深度学习框架、机器学习的框架都有很优秀的Python版本。这篇博客主要为大家介绍5个python生态系中解决NLP任务的框架。

2022/04/10 20:23:13 阅读 2273

#NLP##工具#

OpenAI第二代DALL·E发布，可以使用自然语言创造和编辑图片的模型

今天，时隔一年后，OpenAI发布了第二代的DALL·E模型。相比较第一代的模型，DALL·E 2，以4倍的分辨率生成更真实和准确的图像。

2022/04/06 23:25:38 阅读 3067

#OpenAI##语言模型#

Google最新超大模型Pathways：一个会讲笑话的6400亿参数的语言模型

今天，Google介绍了一个新的语言模型，一个Pathways语言模型：PaLM，这是一个用Pathways系统训练的5400亿个参数、仅有dense decoder的Transformer模型，在数百个语言理解和生成任务上对PaLM进行了评估，发现它在大多数任务中实现了最先进的性能，在许多情况下都有显著的优势。

2022/04/05 11:13:04 阅读 1407

#论文快讯##语言模型#

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

3月29日，DeepMind发表了一篇论文，"Training Compute-Optimal Large Language Models"，表明基本上每个人--OpenAI、DeepMind、微软等--都在用极不理想的计算方式训练大型语言模型。论文认为这些模型对计算的使用一直处于非常不理想的状态。并提出了新的模型缩放规律。

2022/04/04 13:14:09 阅读 2879

#deepmind##论文快讯##语言模型#

用户小木的博客