数据学习
登录
注册
原创博客
期刊会议
学术世界
期刊出版社
领域期刊
SCI/SCIE/SSCI/EI简介
期刊列表
会议列表
所有期刊分区
学术期刊信息检索
JCR期刊分区查询
CiteScore期刊分区查询
中科院期刊分区查询
领域期刊分区
管理 - UTD24期刊列表
管理 - AJG(ABS)期刊星级查询
管理 - FMS推荐期刊列表
计算机 - CCF推荐期刊会议列表
高校期刊分区
南大核心(CSSCI)
合工大小核心
合工大大核心
AI资源仓库
AI领域与任务
AI研究机构
AI学术期刊
AI论文快讯
AI预训练模型
AI数据集
AI开源工具
数据推荐
网址导航
我的网址导航
程序员必备网站
Stable Diffusion的最新实现——KerasCV的官方实现!
标签:
#KerasCV#
#stablediffusion#
#text-to-image#
时间:2022/09/29 23:31:03
作者:小木
Stable Diffusion是一种功能强大的开源文本到图像(Text-to-Image)生成模型。虽然目前有多个开源项目可以实现基于文本提示(prompt)创建图像,但Stable Diffusion性能极其强大,其结果甚至可以媲美DALL·E2。而现在KerasCV提供了这个模型的官方实现! KerasCV是由Keras官方团队发布的一个计算机视觉框架,可以帮助大家用来处理计算机视觉领域的相关任务和问题。这是2022年4月刚发布的最新产品,由于是官方团队出品的工具,所以质量有保证,且社区活跃,一直在积极更新(详情:[KerasCV简介](https://www.datalearner.com/blog/1051664460763153 "KerasCV简介"))。 当然,目前Stable Diffusion已经有多个团队做了开源实现,但是KerasCV实现的Stable Diffusion有一些明显的优势。其中包括XLA编译和混合精度支持,它们共同实现了最快的生成速度。 KerasCV使用Stable Diffusion非常简单: ```python import time import keras_cv from tensorflow import keras import matplotlib.pyplot as plt model = keras_cv.models.StableDiffusion(img_width=512, img_height=512) images = model.text_to_image("photograph of an astronaut riding a horse", batch_size=3) def plot_images(images): plt.figure(figsize=(20, 20)) for i in range(len(images)): ax = plt.subplot(1, len(images), i + 1) plt.imshow(images[i]) plt.axis("off") plot_images(images) ``` 接下来运行执行即可,生成结果如下:

代码十分简单,也很容易实现!可以抓紧使用起来了! 需要注意的是,除了上述引入的库,还需要安装tensorflow datasets(采用如下命令:`pip install tensorflow_datasets`即可)。首次使用会下载预训练好的模型(3-5个G左右),需要一点时间,然后就可以运行了,我的台式机上述程序生成大约800秒,有点慢,不过没有开GPU了。官方的时间还是比较快的。

大家可以使用!
相关博客
最热博客