ST

Stable Zero123

Stable Zero123

发布时间: 2023-12-13204
模型参数
40.0亿
上下文长度
2K
中文支持
不支持
推理能力

模型基本信息

推理过程
不支持
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
视觉大模型
发布时间
2023-12-13
模型文件大小
858
MoE架构
总参数 / 激活参数
40.0 亿 / 不涉及
知识截止
暂无数据
推理模式
暂无模式数据

开源和体验地址

代码开源状态
开源不可商用
预训练权重开源
开源不可商用- 不可以商用
在线体验
暂无在线体验地址

官方介绍与博客

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。

评测得分

当前尚无可展示的评测数据。

发布机构

模型解读

模型简介

Stable Zero123是一个革命性的三维对象生成模型,基于Stable Diffusion 1.5开发。它专注于从不同角度理解和生成对象的新视图。与先前的Zero1-to-3或Zero123-XL模型相比,由于改进了训练数据集和高程条件化处理,Stable Zero123展示了更高质量的结果。

技术细节

  1. 数据集和渲染技术: Stable Zero123使用改进的训练数据集,从Objaverse中筛选出高质量的3D对象,并采用更加逼真的渲染方法。
  2. 高程条件化: 在训练和推断过程中,模型被提供了估计的相机角度,这使得它能做出更高质量的预测。
  3. 预计算数据集与高效数据加载器: 结合第一项创新,这些技术实现了与Zero123-XL相比40倍的训练效率提升。
  4. VRAM使用和性能: Stable Zero123在生成单个新视图时,消耗与SD1.5相同的VRAM。但是,生成3D对象需要更多时间和内存(推荐24GB VRAM)。

Stable Zero123的效果


将Stable Zero123与Zero123-XL在不同视角下的预测结果进行比较。对比如下,可以看到Stabe Zero123的细节更加细致一点。



使用方式

  • 这个模型是不可商用的,只能用于研究目的!
  • 3D对象创建: 改进了threestudio的开源代码,以支持Zero123和Stable Zero123,使用Score Distillation Sampling(SDS)优化NeRF,从而创建纹理化的3D网格。这个过程可以通过首先使用SDXL生成单一图像,然后使用Stable Zero123生成3D对象来适应文本到3D的生成。

结论

Stable Zero123代表了3D对象生成领域的一个重要进步,通过其创新的技术,为研究和非商业用途提供了强大的工具。虽然它目前不适用于商业目的,但它开启了3D视觉和图像生成技术新篇章的大门。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码