DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
工具
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Stable Diffusion-2.0
ST

Stable Diffusion-2.0

Stable Diffusion 2.0

发布时间: 2022-11-24更新于: 2023-03-14 10:14:04.422728
在线体验GitHubHugging FaceCompare
模型参数
9.83亿
上下文长度
2K
中文支持
不支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Stable Diffusion-2.0

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
发布时间
2022-11-24
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
9.83 亿 / 不涉及
知识截止
暂无数据
Stable Diffusion-2.0

开源和体验地址

代码开源状态
暂无数据
预训练权重开源
暂无数据
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
Stable Diffusion-2.0

官方介绍与博客

官方论文
High-Resolution Image Synthesis with Latent Diffusion Models
DataLearnerAI博客
暂无介绍博客
Stable Diffusion-2.0

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
Stable Diffusion-2.0

评测结果

当前尚无可展示的评测数据。
Stable Diffusion-2.0

发布机构

Stability AI
Stability AI
查看发布机构详情
Stable Diffusion 2.0

模型解读

SD2全称是Stable Diffusion 2.0,是继Stabale Diffusion 1.5之后重大的升级版本。

Stable Diffusion是一个Text-to-Image大模型,由ComputeVis与RunwayML合作开发的图片生成大模型。StabilityAI贡献了计算资源并开源到业界。与OpenAI DALL·E2和谷歌Imagen的收费使用不同,SD的开源在业界引起了很大的关注。

2.0版本的Stable Diffusion有多项升级。


新的Text-to-Image的Diffusion模型

Stabale Diffusion 2.0版本包括使用全新的文本编码器(OpenCLIP)训练的健Text-to-Image模型,该编码器由LAION在StabilityAI的支持下开发,与早期的V1版本相比,这大大提高了生成图像的质量。此版本中的文本到图像模型可以生成默认分辨率为512x512像素和768x768像素的图像。


这些模型在StabilityAI的DeepFloyd团队创建的LAION-5B数据集的美学子集上进行训练,然后使用LAION的NSFW过滤器进一步过滤以删除成人内容。


超分辨率上标度器扩散模型

Stabale Diffusion2.0还包括一个Upscaler扩散模型,可将图像的分辨率提高4倍。模型可以将低分辨率生成的图像(128x128)放大为高分辨率图像(512x512)。结合我们的文本到图像模型,Stabale Diffusion2.0现在可以生成分辨率为2048x2048甚至更高的图像。


Depth-to-Image

Stabale Diffusion2.0提供了一个新的功能,Depth-to-Image,扩展了V1以前的图像到图像功能,为创造性应用提供了全新的可能性。Depth-to-Image推断输入图像的深度(使用现有模型),然后使用文本和深度信息生成新图像。

这个功能十分有价值,可以用来生成3D模型或者是VR内容。主要原理就是先使用 MiDaS 来推断图片的深度信息(depth)。然后根据文本和原始图像来生成新的图片。值得期待!


图像修正(更新)- Updated Inpainting Diffusion Model

Stabale Diffusion2.0还包括一个新的文本引导修复模型,在新的Stabale Diffusion2.0基础Text-to-Image上进行了微调,这使得它超级容易切换替换修复图片中的部分内容。


目前,Stabale Diffusion2.0的预训练结果文件还未公布,将在未来几日公布。

基础模型

SD
SD
查看详情

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码