OpenAI第二代DALL·E发布,可以使用自然语言创造和编辑图片的模型
3,012 阅读
2021年1月份,OpenAI发布了他们的DALL·E模型,它能从文字说明中创建图像,用于表达各种可由自然语言表达的概念。
今天,时隔一年后,OpenAI发布了第二代的DALL·E模型。相比较第一代的模型,DALL·E 2,以4倍的分辨率生成更真实和准确的图像。下图是二者的对比,可以看到第二代明显更加优秀。简直是不可思议,虽然都是莫奈的画风,但是第二个更加惊艳。

第一代的DALL·E是GPT-3的120亿个参数版本,通过使用文本-图像对的数据集,训练它从文本描述中生成图像。它有一系列不同的能力,包括创建动物和物体的拟人化版本,以合理的方式组合不相关的概念,渲染文本,以及对现有图像进行转换。
在基于文本创作图像的能力上,DALL·E 2的逼真度和与文本的匹配度更加优秀,根据实际的数据,标题匹配和逼真度的比例分别是71.7%和88.8%。
我们可以看几个DALL·E2的实际例子: 与DALL·E的对比:


