OpenAI第二代DALL·E发布，可以使用自然语言创造和编辑图片的模型

标签：#OpenAI##语言模型# 时间：2022/04/06 23:25:38 作者：小木

2021年1月份，OpenAI发布了他们的DALL·E模型，它能从文字说明中创建图像，用于表达各种可由自然语言表达的概念。

今天，时隔一年后，OpenAI发布了第二代的DALL·E模型。相比较第一代的模型，DALL·E 2，以4倍的分辨率生成更真实和准确的图像。下图是二者的对比，可以看到第二代明显更加优秀。简直是不可思议，虽然都是莫奈的画风，但是第二个更加惊艳。

第一代的DALL·E是GPT-3的120亿个参数版本，通过使用文本-图像对的数据集，训练它从文本描述中生成图像。它有一系列不同的能力，包括创建动物和物体的拟人化版本，以合理的方式组合不相关的概念，渲染文本，以及对现有图像进行转换。

在基于文本创作图像的能力上，DALL·E 2的逼真度和与文本的匹配度更加优秀，根据实际的数据，标题匹配和逼真度的比例分别是71.7%和88.8%。

我们可以看几个DALL·E2的实际例子：
与DALL·E的对比：

还有一个，用逼真的风格画一个骑马的宇航员，这效果，惊呆了，那是不是以后我们写文章配图都直接可以跟模型说，来给各位网友在这个地方画一个我惊呆了的表情包。

哈哈哈，该说不说，OpenAI的发布的很多模型简直是太好了，可惜的是国内用不了它的API，我尝试注册，还需要非VoIP的手机号，就此作罢~~