Grok Imagine 0.9

多模态大模型

Grok Imagine v0.9

发布时间: 2025-10-05更新于: 2025-10-08 11:30:26756

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

32K

中文支持

不支持

推理能力

Grok Imagine v0.9 是由 xAI 发布的 AI 模型，发布时间为 2025-10-05，定位为多模态大模型，上下文长度为 32K，采用不开源许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Grok Imagine 0.9

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

32K tokens

最大输出长度

暂无数据

模型类型

多模态大模型

输入/输出模态

文本、图像 → 图像、音频、视频

发布时间

2025-10-05

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Grok Imagine 0.9

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://grok.com/imagine

Grok Imagine 0.9

官方介绍与博客

官方论文

xAI on X: Introducing Imagine v0.9

DataLearnerAI博客

暂无介绍博客

Grok Imagine 0.9

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
图像	-	$0.0000/ img	$0.070/ img

Grok Imagine 0.9

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Grok Imagine 0.9

发布机构

xAI

查看发布机构详情

Grok Imagine v0.9

模型解读

简介与核心特点

Grok Imagine v0.9 是 xAI 在 Grok 应用内上线的图像/短视频生成功能的重大升级版本。官方表述显示，该版本在视频运动质量与音频生成方面有显著提升，并面向用户开放体验。

架构与技术规格

xAI 曾在 2024-12-09 的官方发布中介绍其自研自回归图像生成引擎（代号 Aurora）。v0.9 作为 Imagine 的后续升级，面向终端应用提供更高质量的图像与可动图/短视频生成能力。当前未披露参数量、上下文窗口或数据细节；因此本节仅依据已公开的官方材料做客观概述。

核心能力与支持模态

文本→图像/视频：输入文本提示，可生成高质量静态图像与带音频的短时动态视频（“AI Vine”式短片）。
图像参与生成：官方渠道与主流报道均显示 Imagine 支持以图像为基础进行动画化或编辑，再导出视频与音频。
音频输出：v0.9 明确强调了音频生成能力，生成的视频可同步包含声音。

性能与评测

截至目前，官方未发布针对 v0.9 的标准化基准分数（例如 MMLU/GPQA 等）。

应用场景与限制

Grok Imagine v0.9 的定位是面向用户侧的图像与短视频创作，适用于社媒短内容、创意分镜、快速概念演示等场景。关于允许/限制的具体内容与使用边界，应以 Grok 应用及 X 平台的最新使用条款与合规策略为准。

访问方式与许可

目前通过 Grok 应用体验，未见针对 v0.9 的独立 API 定价/计费页面与开源发布；因此本条目的代码与权重开源均置为“不开源”。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送