Gr

Grok Imagine 0.9

多模态大模型

Grok Imagine v0.9

发布时间: 2025-10-05

167
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
32K
是否支持中文
不支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

不支持

最高上下文输入长度

32K tokens

最长输出结果
暂无数据
模型类型

多模态大模型

发布时间

2025-10-05

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

官方介绍与博客

官方论文
DataLearnerAI博客
暂无介绍博客

API接口信息

接口速度(满分5分)
接口价格
暂无公开的 API 定价信息。

Grok Imagine 0.9模型在各大评测榜单的评分

当前尚无可展示的评测数据。

Grok Imagine v0.9模型解读

简介与核心特点

Grok Imagine v0.9 是 xAI 在 Grok 应用内上线的图像/短视频生成功能的重大升级版本。官方表述显示,该版本在视频运动质量音频生成方面有显著提升,并面向用户开放体验。

架构与技术规格

xAI 曾在 2024-12-09 的官方发布中介绍其自研自回归图像生成引擎(代号 Aurora)。v0.9 作为 Imagine 的后续升级,面向终端应用提供更高质量的图像与可动图/短视频生成能力。当前未披露参数量、上下文窗口或数据细节;因此本节仅依据已公开的官方材料做客观概述。

核心能力与支持模态

  • 文本→图像/视频:输入文本提示,可生成高质量静态图像与带音频的短时动态视频(“AI Vine”式短片)。
  • 图像参与生成:官方渠道与主流报道均显示 Imagine 支持以图像为基础进行动画化或编辑,再导出视频与音频。
  • 音频输出:v0.9 明确强调了音频生成能力,生成的视频可同步包含声音。

性能与评测

截至目前,官方未发布针对 v0.9 的标准化基准分数(例如 MMLU/GPQA 等)。

应用场景与限制

Grok Imagine v0.9 的定位是面向用户侧的图像与短视频创作,适用于社媒短内容、创意分镜、快速概念演示等场景。关于允许/限制的具体内容与使用边界,应以 Grok 应用及 X 平台的最新使用条款与合规策略为准。

访问方式与许可

目前通过 Grok 应用体验,未见针对 v0.9 的独立 API 定价/计费页面与开源发布;因此本条目的代码与权重开源均置为“不开源”。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat