DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
目录
目录
  1. 首页/
  2. 博客列表/
  3. 博客详情

神秘的图片生成和编辑大模型Nano Banana是什么?背后是Google吗?什么时候发布?能否颠覆Adobe

2025/08/24 16:43:54
1,238 阅读
NanoBanana图片生成大模型图片编辑大模型

最近,一个代号 “Nano Banana” 的神秘图像生成与编辑大模型突然在社交网络上掀起风暴。与此前所有模型截然不同,它似乎拥有保持人脸一致性的能力:无论角度、光影如何变化,人物的面容始终稳定;它还能读懂照片里的故事,精准捕捉场景氛围,并服从多步骤、高复杂度的指令。然而,它的来源仍然完全成谜——没有官方文档,没有作者署名,甚至没有一行技术白皮书。极致的神秘感与惊人的效果形成巨大反差,像磁铁般吸住了整个社区的目光:它究竟出自谁手?能力边界到底在哪儿?

nano banana大模型简介
nano banana大模型简介

本文会介绍一下这个模型当前已知的信息,以及如何使用。

  • Nano Banana模型特点
  • Nano Banana模型在一致性方面表现优秀,人物表情更自然
  • Nano Banana模型图片情景理解强,场景保持很好
  • Nano Banana模型可以基于现有真实图片引用合成
  • Nano Banana甚至可以做人体3D建模和标注
  • Nano Banana模型很有可能是Google的Gemini模型的多模态版本
  • 如何使用Nano Banana
  • Nano Banana总结

Nano Banana模型特点

Nano Banana最早出现在大模型匿名竞技场的官网LM Arena上,在图像生成和编辑的对比测试中出现。但是,这个模型无法直接选择并对话,只能通过匿名对比的方式随机命中。

随着用户接触增多,逐渐发现该模型的表现明显不同于现有主流模型。

Nano Banana模型在一致性方面表现优秀,人物表情更自然

在当前的图片生成和编辑大模型中,一个最大的难题是保持人物或者事物的一致性。例如,图像编辑或者转换场景的时候,人脸很难保持原有的一致性,此外光照、背景等也常常发生不合理的变化。

但是Nano Banana在这方面表现很好。如下图所示,这是一个Nano Banana更改人物表情的测试,结果非常自然,几乎难以分辨与真实照片的差异。

![](https://www.datalearner.com/resources/blog_images/ae1ba901-80b7-457d-b300-5bd58ebdfa1e.webp )
对比来自@hellorob

相比较当前的模型,如Kontext等,Nano Banana模型更加自然,也没有那么夸张。以“惊讶”为例,对比一下Nano Banana和Kontext,后者显得更加夸张。

Nano Banana模型图片情景理解强,场景保持很好

除了一致性外,Nano Banana对于图片情景的理解和真实性保持也非常好。以下图为例,原始图片的两位女士的场景和灯光保持不变的情况下,让她们移动到台球桌边并表现为正在打台球。Nano Banana都可以在场景、灯光、风格保持一致的情况下完成转换,且真实性很好。

![](https://www.datalearner.com/resources/blog_images/3f25ed85-8d61-484c-8291-cd5327719d1b.webp )
测试来自@D_studioproject

Nano Banana模型可以基于现有真实图片引用合成

除了上述编辑外,在图片合成方面也很突出。它不仅支持基于文本生成图片,还可以接收多张原始图片作为输入,然后通过文本指令合成一个新的图片。新图片里的元素会引用原始图片:

![](https://www.datalearner.com/resources/blog_images/f4044f45-d1be-48dc-b219-de39f5916eec.webp )
测试来自@HalimAlrasihi

这个测试是让Nano Banana将已有的4张图片的元素组合到一起,形成一个新的图片。可以看到,新图片质量很好,几乎保留了原图片的全部细节,仅在局部(如鞋带)上存在轻微瑕疵。

Nano Banana甚至可以做人体3D建模和标注

除了前面的合成和编辑外,大家还发现Nano Banana对于照片的3D建模也很不错,甚至是人体的3D建模和骨骼标注。

![](https://www.datalearner.com/resources/blog_images/46e9087f-d53d-4eda-914d-4ed22b20e037.webp )

上图直接通过prompt,将荷兰弟的体型3D标注出来了,非常精准,手腕、衣服褶皱部分的建模都很准确。

DataLearnerAI也在其它模型上测试过类似的指令,包括GPT-Image-1、Qwen-Edit、Kontext等,细节表现都不理想。例如,GPT-Image-1经常会生成面部模糊或陌生的人脸,与Nano Banana相比差距明显。

Nano Banana模型很有可能是Google的Gemini模型的多模态版本

截止目前,并没有任何关于Nano Banana的官方信息。没有任何一家公司或品牌公开承认该模型与他们相关。但目前已有不少线索指向Google。

首先,最直接的线索是多位Google的AI相关人员在X平台上发布与banana相关的emoji或图片。例如Google的VP Josh Woodward发布了this is 🍌 !推文,随后Google NotebookLM负责人Simon转发并配图了一个“3+Bananas”的图片,耐人寻味。

![](https://www.datalearner.com/resources/blog_images/23dc8447-afcd-4db8-b499-851376d84ea8.webp )

据此,很多人猜测Google将在9月3日发布这个全新的模型(也有人认为可能是Gemini 3)。

尽管Google当前已经有图像生成大模型Imagen,版本甚至迭代到Imagen 4。但Imagen的核心仍是文本生成图片,编辑功能并非重点(AI Studio甚至未开放)。而Gemini目前虽然能处理多模态输入,但还不能生成图片。因此,如果Nano Banana确实与Google相关,它更可能是Gemini体系下的新尝试,而非Imagen的直接延续。

如何使用Nano Banana

Nano Banana目前非常火爆,但公开可用的方式只有在LM Arena的Battle模式中进行图片生成和编辑。这意味着你只能多次参与LM Arena的大模型匿名竞技,并对生成图片进行投票,投票结束后才会显示是否使用了Nano Banana模型。

![](https://www.datalearner.com/resources/blog_images/bc6f16e3-186d-42b3-a5f8-8e0936f0ca44.webp )

如上图所示,左侧就是Nano Banana的结果,只有在投票后才会揭示。需要注意的是,选择直接对话或非匿名对比模式时,并不能主动选择该模型。此外,目前有不少第三方网站(多为.ai或.io域名)冒充Nano Banana的入口,甚至开放充值通道,需警惕风险。

Nano Banana总结

无论Nano Banana最终归属哪家公司,多模态生成模型已经进入新的阶段。

此前,人们普遍认为多模态大模型虽然能生成创意结果,但在真实世界理解、人物一致性等方面仍较弱,因此难以替代Adobe等专业工具。如今,随着多模态大模型的发展,这一观点正在被逐步打破。未来相关从业者可能逐渐转型为基于大模型结果的优化者,而行业的核心门槛也可能从技术实现转向创意构思。

关于Nano Banana模型的信息以及未来的变化情况,可以关注DataLearnerAI的大模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/nano-banana

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • 如何让Nano Banana Pro生成更好的图片?Nano Banana Pro 提示词写作官方教程
  • 重磅!谷歌发布 Nano Banana Pro(Gemini 3 Pro Image):图像生成质量大幅提升!一次可以支持14张图片合成,5个对象保持一致!图像生成正式进入“理解驱动”阶段!

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署