Veo 3.1 Generate (Preview) 参数、价格与评测详解 | DataLearnerAI

Veo 3.1 Generate (Preview) 参数、价格与评测详解 | DataLearnerAI

Google Veo 3.1 Generate (Preview)

模型解读

Veo 3.1 概览

Veo 3.1 是 Google（DeepMind）视频生成模型 Veo 系列在 3 代基础上的一次更新版本，第三方权威媒体与生态合作方称其将带来更长时长（最高可达约 1 分钟的 1080p）、多镜头/多场景叙事、一致的角色与场景保持，以及更自然的镜头运动与过渡等能力。当前信息主要来自发布前报道与生态平台页面，尚无官方技术白皮书或详细规格公开。

定位与核心目标

在 Veo 3 的文本/图像到视频生成功能之上，Veo 3.1 重点面向更复杂的叙事创作与镜头编排，旨在提升长镜头、一致性与可控性（如镜头/光影预设、多镜头拼接）。

架构与技术规格

参数规模与 MoE：官方尚未披露。
上下文窗口：视频生成模型不以 token 窗口计，官方未披露相关口径。
训练数据：未披露。

核心能力与模态

输入模态：文本提示，支持图像参考（多方报道与产品页）。
输出模态：视频（据称 1080p，最长约 1 分钟），并延续 Veo 3 的原生音频合成能力（环境声、对白、音效）。
镜头与叙事：多镜头/多场景、角色一致性、镜头运动与光影预设。

性能与评测

目前未见官方基准测试数据（如与 Sora 2 或其他模型的定量对比分数）。媒体与生态产品页多为功能性描述与示例。

应用场景与限制

推荐用例：宣传片、产品演示、分镜脚本验证、短片叙事、多镜头剪辑草稿生成。
已知限制：处于预发布与生态预览集成阶段，功能、时长/分辨率与可用性可能随正式发布而调整。

访问方式与许可

访问：尚无该版本专属官方互动演示页可核验；部分第三方创作平台宣称接入预览能力。
开源与许可：非开源，未见公开模型权重。

参考资料：Google DeepMind：Veo 官方页；TechRadar：Veo 3.1 报道；The Verge：Veo 3 更新（竖屏/1080p与价格）；以及生态平台对 Veo 3.1 的预告（例如 ImagineArt、Higgsfield）。