DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogDeepFloyd IF
DE

DeepFloyd IF

DeepFloyd IF

Release date: 2023-04-26更新于: 2023-04-27 22:28:44.152200
Live demoGitHubHugging FaceCompare
Parameters
43.0亿
Context length
2K
Chinese support
Not supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

DeepFloyd IF

Model basics

Reasoning traces
Not supported
Context length
2K tokens
Max output length
No data
Model type
基础大模型
Release date
2023-04-26
Model file size
No data
MoE architecture
No
Total params / Active params
43.0B / N/A
Knowledge cutoff
No data
Inference modes
No mode data
DeepFloyd IF

Open source & experience

Code license
No data
Weights license
No data
GitHub repo
https://github.com/deep-floyd/IF
Hugging Face
Hugging Face link unavailable
Live demo
No live demo
DeepFloyd IF

Official resources

Paper
No paper available
DataLearnerAI blog
No blog post yet
DeepFloyd IF

API details

API speed
No data
No public API pricing yet.
DeepFloyd IF

Benchmark Results

No benchmark data to show.
DeepFloyd IF

Publisher

Deep Floyd
Deep Floyd
View publisher details
DeepFloyd IF

Model Overview

DeepFloyd IF简介

DeepFloyd IF是由DeepFloyd、StabilityAI和LAION三家协作开发的一个Text-to-Image模型。它使用的是与Google Imagen类似的架构完成的一个图片生成模型。


DeepFloyd IF模型原理

DeepFloyd IF是一个具有高度照片级别真实感和语言理解能力的新型最先进的开源文本到图像模型。DeepFloyd IF是一个模块化的组合,由一个冻结的文本编码器和三个级联的像素扩散模块组成:一个基础模型,基于文本提示生成64x64像素的图像,以及两个超分辨率模型,分别设计用于生成分辨率逐步增加的图像:256x256像素和1024x1024像素。


模型的所有阶段都利用基于T5 transformer的冻结文本编码器提取文本嵌入,然后将其馈送到一个带有交叉注意力和注意力池化的UNet架构中。这是一个高效的模型,胜过当前最先进的模型,在COCO数据集上实现了零-shot FID得分为6.66。



DeepFloyd IF开源结果

DeepFloyd IF模型完全开源,目前已知包括7个模型,其参数规模和迭代步骤等信息如下:


模型名称级联级别参数规模Batch大小迭代次数
IF-I-MI400M3072250万
IF-I-LI900M3200300万
IF-I-XL*I4.3B3072242万
IF-II-MII450M1536250万
IF-II-L*II1.2B1536250万
IF-III-L* (soon)III700M3072125万



DeepFloyd IF效果

从官方展示的结果来看,DeepFloyd IF效果十分经验。




DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码