DataLearner 标志DataLearnerAI
AI技术博客
大模型评测排行
大模型评测基准
AI大模型大全
AI资源仓库
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
  1. 首页/
  2. 博客列表/
  3. 博客详情

Stable Diffusion2.1发布!

2022/12/08 00:33:51
2,752 阅读
StabilityAIStableDiffusionText-to-Image

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

大模型企业宫斗连续剧:刚刚发生!StabilityAI重要技术人员出走后CEO辞职!HuggingFace CEO说考虑收购StabilityAIStabilityAI发布实时文本生成图片大模型SDXL Turbo——生成一张图片可能只需要0.207秒可能比runway更好!StabilityAI最新开源文本生成视频大模型:Stable Video Diffusion,可以生成最多20帧的视频,但不可商用开源可商用大模型再添重磅玩家——StabilityAI发布开源大语言模型StableLM扩散模型是如何工作的:从0开始的数学原理——How diffusion models work: the math from scratchStable Diffusion的最新实现——KerasCV的官方实现!Stable Diffusion的Tensorflow/Keras实现及使用Text-to-Video来临!——Meta AI发布最新的视频生成预训练模型最新好课!从深度学习到stable diffusion的手把手入门教程简单几步教你如何在搭建并使用DALL·E开源版本来基于文字生成图片

热门博客

1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)2回归模型中的交互项简介(Interactions in Regression)3贝塔分布(Beta Distribution)简介及其应用4矩母函数简介(Moment-generating function)5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程6使用R语言进行K-means聚类并分析结果7深度学习技巧之Early Stopping(早停法)8H5文件简介和使用9手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署10Wishart分布简介

Stable Diffusion是由StabilityAI公司开源的文本生成图像预训练模型。由于其惊艳的效果与DALL·E2不相上下,但是完全免费开源,吸引力一大批受众,对OpenAI也造成了一定压力,几乎也加快了OpenAI开放自己DALL·E系列的脚本。在2022年11月24日,Stable Diffusion2.0大版本更新刚发布,今天有了新的版本!

刚刚,StabilityAI宣布Stable Diffusion2.1发布。距离Stable Diffusion2.0大版本发布刚2个星期,2.1版本就发布了,2.1版本有诸多改进功能。

主要包括如下:

  • 改进一:更少的成人内容过滤,更丰富的人物结果
  • 改进二、增强“否定提示(negative prompts)”的能力
  • 改进三:更多的训练时长
  • 总结

我们将分别简单介绍一下。

改进一:更少的成人内容过滤,更丰富的人物结果

首先,根据官方描述,Stable Diffusion是基于LAION-5B数据训练的,但是做了严格的成人内容过滤,尽管这样的操作保护了内容的结果,但也造成了大量涉及到“人”的元素的减少,因此,在2.1版本中,训练数据中采取了更加宽松的成人内容过滤策略,使得关于“人”的图像更加丰富。如下图所示:

上图的提示模板如下: ``` Prompt: a portrait of a beautiful blonde woman, fine - art photography, soft portrait shot 8 k, mid length, ultrarealistic uhd faces, unsplash, kodak ultra max 800, 85 mm, intricate, casual pose, centered symmetrical composition, stunning photos, masterpiece, grainy, centered composition : 2 | blender, cropped, lowres, poorly drawn face, out of frame, poorly drawn hands, blurry, bad art, blurred, text, watermark, disfigured, deformed, closed eyes : -2 / Stable Diffusion v2.1-768 ```

可以看到更加丰富细节。

改进二、增强“否定提示(negative prompts)”的能力

其次,这个版本对否定提示(negative prompts)提示能力做了增强。在2.0版本中,大家发现否定提示可以帮助我们生成更加好的结果。否定提示与提示相反;它们允许用户告诉模型不生成什么。负面提示通常会消除不必要的细节,如手部破损、手指过多、失焦和图像模糊。

下图就是否定提示的案例:

并排比较没有否定提示(左)和有否定提示(右)的提示。在这种情况下,否定提示用于告诉模型限制树木、灌木、树叶和绿色植物的突出程度,同时保持相同的初始输入提示。这个能力让我们细节更加完美。

改进三:更多的训练时长

最后,2.1版本的模型是基于2.0版本微调的结果,但是基于相同的数据集多训练了5.5万个steps(punsafe=0.1),然后继续以punsafe=0.98训练了15.5万个steps,所以模型能力更强!

总结

相比较DALL·E2,Stable Diffusion系列的图像生成结果不相上下!但是Stable Diffusion是开源了预训练结果的模型,因此受欢迎程度非常高。

Stable Diffusion2.1模型卡片(详细内容):https://www.datalearner.com/ai-resources/pretrained-models/stable-diffusion-2-1