xAI发布Grok Imagine功能,一条文本命令即可生成图片和最长达15秒的视频,也可以基于现有照片生成视频,免费用户也可以使用~
Grok Imagine 是一个由 xAI 开发的创新功能,集成到 Grok AI 聊天机器人中,旨在让用户能够从文本和视觉命令快速生成图像和视频。Grok Imagine最大的特点是能够生成长达 15 秒的视频,带有同步音频,使其成为 OpenAI 的 Sora 和 Google 的 Veo 3 等工具的直接竞争者。此外,它还包括一个“Spicy”模式,允许生成成人或显式内容,这一点引发了伦理和潜在误用的争议。
但最重要的是目前该功能完全免费!

Grok Imaging功能介绍与特点
Grok Imagine 允许用户通过文本和视觉命令生成图像和视频,强调快速、高效的内容创建。目前Grok Imagine仅需几秒即可生成高质量的视觉内容和带音频的视频。
这一功能在 Grok 应用中通过两个主要选项卡实现:“Ask”用于传统的聊天交互,“Imagine”专为图像和视频生成设计。Grok Imagine 能够生成长达 15 秒的视频,带有同步音频,使其成为娱乐、教育、市场营销和社会媒体内容创建的强大工具。
其技术基础是 Aurora AI,这是一个训练有素的自动回归混合专家网络,基于互联网上的数十亿示例进行训练,擅长照片般逼真的渲染和精确遵循文本指令。此外,Grok Imagine 支持多模态输入,包括文本、语音和图像,允许用户上传现有图像进行定制或直接编。
一个引人注目的特点是“Spicy”模式,这允许生成成人或显式内容。这一功能由 Elon Musk 描述为“meme motherlode”,强调其娱乐和分享潜力。然而,这一模式也引发了伦理争议,特别是关于潜在的非自愿深度伪造和非法内容的担忧。
以下是 Grok Imagine 的一些关键特点的总结:
特点 | 描述 |
---|---|
图像生成 | 从文本提示或上传的图像生成高质量图像,支持变体生成。 |
视频生成 | 生成长达 15 秒的视频,带有同步音频,模式包括 Normal、Fun、Custom、Spicy。 |
多模态输入 | 支持文本、语音和图像输入,增强灵活性。 |
快速迭代 | 优化为快速内容创建,适合娱乐和分享。 |
伦理争议 | “Spicy”模式允许成人内容,引发潜在误用和监管关注。 |
Grok Imagine原本计划2025年10月发布,但是当前免费用户也已经可以使用
Grok Imagine 的发布日期经历了多次调整。最初的计划是在 2025 年 10 月提供早期访问,但根据 2025 年 7 月末的官方帖子和新闻报道,它已提前进入早期测试阶段。Elon Musk 在 2025 年 7 月 29 日的帖子中提到,Grok Imagine 处于早期测试阶段,优化为“最大乐趣”,并计划在下一个月(2025 年 8 月)使用 110,000 个 GB200 GPU 训练更强大的视频模型。
2025年8月6日,Grok Imagine 已对 iOS 上的 SuperGrok Heavy 和 Premium+ 用户可用,Android 支持尚未完全推出。
2025年8月8日的最新公告表明,它现在对所有 Grok 应用用户免费,这一变化可能反映了 xAI 扩大用户基础的战略。当前DataLearnerAI测试,更新到最新的Grok客户端之后,免费用户也可访问。
如何使用Grok Imagine
需要注意的是,目前该功能不在网页端开放,尽在iOS和Android客户端开放。
使用 Grok Imagine 需要先下载 Grok 应用,这可在 Google Play Store 或 Apple App Store 上找到。
我们可以先看个截图:

右上角点击Imagine即可进入页面。目前有几个功能:
生成图像:
- 点击右上角的“Imagine”选项卡或“Create Image”按钮。
- 输入文本提示,描述所需的图像(如“一个在阳光下骑行的复古自行车”),或上传现有图像进行定制。
- Grok 会生成图像及其变体,用户可滚动生成更多选项。
- 生成的图像可分享或下载至设备。
生成视频:
- 在生成图像后,选择“Make video”选项。
- 选择模式:Normal(普通)、Fun(有趣)、Custom(定制)或 Spicy(成人内容,注意伦理问题)。
- 视频会自动生成并显示在应用中,最长达 15 秒,带有同步音频。
- 用户可分享或下载生成的视频。
将图像转为视频:
- 点击应用底部的照片图标加号。
- 从手机上传图像。
- 视频会自动生成并显示在应用中。
Grok Imagine可以生成很多个图片和视频
马斯克非常豪横,目前,即使是免费用户也近乎无限制使用Grok Imagine功能。
DataLearnerAI测试了一个生成DataLearnerAI广告的图片功能,一句话提示,下面生成很多不同风格的广告图片,且随着下拉可以看到更多。每一个图片都可以点击右下角的图标再生成视频!


仿佛听见美金在燃烧的声音~
Grok Imagine的争议
Grok Imagine 的推出不仅带来了技术创新,也引发了广泛讨论。Elon Musk 将其描述为“AI Vine”,暗示其短视频分享潜力,类似于已停产的 Vine 应用。然而,“Spicy”模式的引入,特别是允许生成成人内容,引发了伦理和法律关注。TIME 和国家性剥削中心等来源指出,这一功能可能被用于创建非自愿深度伪造或非法材料,呼吁在公开发布前实施更严格的保护措施。
此外,Grok Imagine 的技术基础 Aurora AI 代表了 xAI 在计算基础设施上的重大投资,计划使用超过 100,000 个 NVIDIA GPU 进行实时处理。这一投资反映了其对多模态 AI 创建领域的雄心,但也伴随着监管和公众监督的增加。
感兴趣的小伙伴可以直接去测试了,目前看虽然有些视频比较不错,但是配音还是有点突兀,不是很自然。
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
