Original Blog

Original AI Tech Blogs

Explore the latest AI and LLM news and technical articles, covering original content and practical cases in machine learning, deep learning, and natural language processing.

Sort by

Sort by Date Sort by Views

2022年了，Java和Java的生态怎么样了？

不久前，Java18发布，至此这款编程语言已经走过三十多年。随着近几年深度学习的发展，python已经开始霸榜编程语言，Java的流行度似乎下降很多。那么，如今的Java到底是什么状态，未来它的方向在哪？近期，JRebel对中大型企业技术人员的访谈，给我们一些指引和回答。

2022/03/31 22:13:141,386

#Java #报告

Copilot Labs插件——基于AI的代码解释和代码翻译神器

昨天，Copilot团队推出了一个名为GitHub Copilot Labs的VS Code配套扩展。它独立于（并依赖于）GitHub Copilot扩展。它可以用来解释代码和翻译代码。

2022/04/01 09:39:037,310

#copilot #GitHub

新的对话式语言模型可以将自然语言转换成可执行代码！

2022/04/03 14:30:111,778

#论文快讯

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

3月29日，DeepMind发表了一篇论文，"Training Compute-Optimal Large Language Models"，表明基本上每个人--OpenAI、DeepMind、微软等--都在用极不理想的计算方式训练大型语言模型。论文认为这些模型对计算的使用一直处于非常不理想的状态。并提出了新的模型缩放规律。

2022/04/04 13:14:093,118

#deepmind #论文快讯

Google最新超大模型Pathways：一个会讲笑话的6400亿参数的语言模型

今天，Google介绍了一个新的语言模型，一个Pathways语言模型：PaLM，这是一个用Pathways系统训练的5400亿个参数、仅有dense decoder的Transformer模型，在数百个语言理解和生成任务上对PaLM进行了评估，发现它在大多数任务中实现了最先进的性能，在许多情况下都有显著的优势。

2022/04/05 11:13:041,607

#论文快讯 #语言模型

OpenAI第二代DALL·E发布，可以使用自然语言创造和编辑图片的模型

今天，时隔一年后，OpenAI发布了第二代的DALL·E模型。相比较第一代的模型，DALL·E 2，以4倍的分辨率生成更真实和准确的图像。

2022/04/06 23:25:383,220

#OpenAI #语言模型

Python生态系统中5个NLP工具库

Python是目前最流行的编程语言，也是开放生态做得最好的编程语言之一。大多数深度学习框架、机器学习的框架都有很优秀的Python版本。这篇博客主要为大家介绍5个python生态系中解决NLP任务的框架。

2022/04/10 20:23:132,458

#NLP #工具

使用Jupyter Notebook编程与python脚本编程的差异

Jupyter Notebook虽然在教学等领域有着非常大的优势，但是实际编程中，它的效率、可维护性等方面与python脚本相比的差距到底在哪也一直不那么清晰。就在上个月底，JetBrains的研究人员使用了大量的数据详细对比了二者的差异。这里总结一下其主要结论。

2022/04/10 22:40:352,464

#Jupyter #编程

最近一段时间深度学习大模型的重要进展（2022年4月初）

今晚已经是本周的最后一天了，最近的一些深度学习算法方面的进展做个总结吧，感觉都是挺不错的，供大家参考。

2022/04/10 23:34:551,686

#论文快讯

Python800页免费电子书——Python基本库和著名经典库的使用

《Python Notes For Professionals》是StackOverflow上的人总结的Python使用方法。

2022/04/11 15:55:551,417

#python

正则化和数据增强对模型的影响并不总是好的：The Effects of Regularization and Data Augmentation are Class Dependent

正则化是一种基本技术，通过限制模型的复杂性来防止过度拟合并提高泛化性能。目前的深度网络严重依赖正则化器，如数据增强（DA）或权重衰减，并采用结构风险最小化，即交叉验证，以选择最佳的正则化超参数。然而，正则化和数据增强对模型的影响也不一定总是好的。来自Meta AI研究人员最新的论文发现，正则化是否有效与类别高度相关。

2022/04/11 22:52:181,677

#论文快讯

截至2022年4月份全球大语言模型一览图

Alan D Thompson博士总结的，截至2022年4月份全球大语言模型一览图。

2022/04/12 09:35:021,594

#好物推荐

常用的SQL语句总结

平时很多时候需要用到SQL，一些常见常用的SQL语句总结，后面可以拷贝使用

2022/04/15 23:15:491,212

#SQL #编程

SCI已经被SCIE替代

2020年1月13日，Clarivate官网发布声明称SCI索引将被去除。未来全部使用SCIE代替期刊索引。

2022/04/18 19:33:447,234

#学术 #学术期刊

JCR期刊中的ESCI是什么？它属于SCI索引吗？

很多童鞋在查询期刊的时候会发现某些期刊不是SCI（SCIE）索引，而是一个叫ESCI的索引。这似乎有点像SCI，但好像又有区别，所以大家会有疑问，本篇博客将解释二者的区别。

2022/04/18 19:41:0913,637

#ESCI #SCI

Pandas用法小册子

2022/04/19 09:50:271,075

DeepGraph Library（DGL）发布了0.81版本

2022/04/19 16:03:311,097

#GNN #图神经网络

强烈推荐斯坦福大学的深度学习示意图网站

CS 230 ― Deep Learning是斯坦福大学视觉实验室（Stanford Vision Lab）的Shervine Amidi老师开设的深度学习课程，他在课程网站上挂了一个关于深度学习示意图的网站，这里面包含了各种深度学习相关概念的示意图和动图，十分简单明了。

2022/04/20 23:19:193,187

#深度学习

Bloomberg发布的最新的memray——Python内存分析器是什么？

Bloomberg在2022年4月开源了Memray，这是一个Python的内存分析器。它可以跟踪Python代码、本地扩展模块和Python解释器本身的内存分配情况。可以看numpy和pandas的运行内存使用。

2022/04/21 08:58:471,745

#python #开源

全球主要开源组织概述

开源软件在现代互联网技术的发展中扮演者重要的作用。很多技术的进步和发展都是由开源软件推动的。而开源软件的发展离不开背后强大的开源组织的管理。本文列举最著名的五个开源组织，简述其背景，欢迎大家阅读。

2022/04/23 21:21:112,922

#开源

期刊审稿周期查询方法

科研成果发表速度对于国内的硕士生和博士生来说非常重要，它涉及了同学们的毕业、出国和奖学金等。很多童鞋在投稿之前都希望了解期刊的审稿周期。虽然大多数期刊没有规定明确的审稿时间，但是，随着大家对学术期刊投稿周期的关注，很多学术期刊也开始就自己的审稿速度开始有所要求，本文针对常见的期刊审稿周期提供一个普遍的分析方法。

2022/04/24 22:29:3715,172

#学术期刊

开源利器！一个文件实现完整的强化学习算法

很多算法的开源实现都包含多个文件，因此，学习这些开源代码的时候通常难以找到入口，也无法快速理解作者的逻辑，对于学习的童鞋来说都带来了不小的挑战。这里推荐一个非常优秀的强化学习开源库，它将经典的强化学习算法都实现在一个文件中，想要学习源代码的童鞋只需要看单个文件即可，这就是ClearRL!

2022/05/03 17:10:151,852

#强化学习

超越Cross-Entropy Loss（交叉熵损失）的新损失函数——PolyLoss简介

Google旗下自动驾驶公司Waymo的研究人员Mingxing Tan发现了一个可以替代Cross-Entropy Loss的新的损失函数：PolyLoss，这是发表在ICLR 22的一篇新论文。什么都不变的情况下，只需要将损失函数的代码替换成PolyLoss，那么模型在图像分类、图像检测等任务的性能就会有很好的提升！

2022/05/03 17:31:302,493

#损失函数 #深度学习

2022年了，Java和Java的生态怎么样了？

Copilot Labs插件——基于AI的代码解释和代码翻译神器

新的对话式语言模型可以将自然语言转换成可执行代码！

大型语言模型的新扩展规律（DeepMind新论文）——Training Compute-Optimal Large Language Models

Google最新超大模型Pathways：一个会讲笑话的6400亿参数的语言模型

OpenAI第二代DALL·E发布，可以使用自然语言创造和编辑图片的模型

Python生态系统中5个NLP工具库

使用Jupyter Notebook编程与python脚本编程的差异

最近一段时间深度学习大模型的重要进展（2022年4月初）

Python800页免费电子书——Python基本库和著名经典库的使用

正则化和数据增强对模型的影响并不总是好的：The Effects of Regularization and Data Augmentation are Class Dependent

截至2022年4月份全球大语言模型一览图

常用的SQL语句总结

SCI已经被SCIE替代

JCR期刊中的ESCI是什么？它属于SCI索引吗？

Pandas用法小册子

DeepGraph Library（DGL）发布了0.81版本

强烈推荐斯坦福大学的深度学习示意图网站

Bloomberg发布的最新的memray——Python内存分析器是什么？

推荐一个给新手的可视化的机器学习模型训练网站

全球主要开源组织概述

期刊审稿周期查询方法

开源利器！一个文件实现完整的强化学习算法

超越Cross-Entropy Loss（交叉熵损失）的新损失函数——PolyLoss简介