ST

Stable Zero123

视觉大模型

Stable Zero123

发布时间: 2023-12-13更新于: 2023-12-14 09:13:30.284328

在线体验GitHub Hugging Face Compare

模型参数

40亿

上下文长度

2K

中文支持

不支持

推理能力

Stable Zero123 是由 Stability AI 发布的 AI 模型，发布时间为 2023-12-13，定位为视觉大模型，参数规模约为 40亿，上下文长度为 2K，模型文件大小约 858，采用开源不可商用许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Stable Zero123

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

2K tokens

最大输出长度

暂无数据

模型类型

视觉大模型

输入/输出模态

暂无数据

发布时间

2023-12-13

模型文件大小

858

MoE架构

否

总参数 / 激活参数

40亿 / 不涉及

知识截止

暂无数据

Stable Zero123

开源和体验地址

代码开源状态

开源不可商用

预训练权重开源

开源不可商用- 不可商用

GitHub 源码

https://github.com/threestudio-project/threestudio#stable-zero123

Hugging Face

https://huggingface.co/stabilityai/stable-zero123

在线体验

暂无在线体验地址

Stable Zero123

官方介绍与博客

官方论文

Introducing Stable Zero123: Quality 3D Object Generation from Single Images

DataLearnerAI博客

暂无介绍博客

Stable Zero123

API接口信息

接口速度

暂无数据

暂无公开的 API 定价信息。

Stable Zero123

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Stable Zero123

发布机构

Stability AI

查看发布机构详情

Stable Zero123

模型解读

模型简介

Stable Zero123是一个革命性的三维对象生成模型，基于Stable Diffusion 1.5开发。它专注于从不同角度理解和生成对象的新视图。与先前的Zero1-to-3或Zero123-XL模型相比，由于改进了训练数据集和高程条件化处理，Stable Zero123展示了更高质量的结果。

技术细节

数据集和渲染技术: Stable Zero123使用改进的训练数据集，从Objaverse中筛选出高质量的3D对象，并采用更加逼真的渲染方法。
高程条件化: 在训练和推断过程中，模型被提供了估计的相机角度，这使得它能做出更高质量的预测。
预计算数据集与高效数据加载器: 结合第一项创新，这些技术实现了与Zero123-XL相比40倍的训练效率提升。
VRAM使用和性能: Stable Zero123在生成单个新视图时，消耗与SD1.5相同的VRAM。但是，生成3D对象需要更多时间和内存（推荐24GB VRAM）。

Stable Zero123的效果

将Stable Zero123与Zero123-XL在不同视角下的预测结果进行比较。对比如下，可以看到Stabe Zero123的细节更加细致一点。

使用方式

这个模型是不可商用的，只能用于研究目的！
3D对象创建: 改进了threestudio的开源代码，以支持Zero123和Stable Zero123，使用Score Distillation Sampling（SDS）优化NeRF，从而创建纹理化的3D网格。这个过程可以通过首先使用SDXL生成单一图像，然后使用Stable Zero123生成3D对象来适应文本到3D的生成。

结论

Stable Zero123代表了3D对象生成领域的一个重要进步，通过其创新的技术，为研究和非商业用途提供了强大的工具。虽然它目前不适用于商业目的，但它开启了3D视觉和图像生成技术新篇章的大门。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码