加载中...
加载中...
Follow DataLearner WeChat for the latest AI updates

Sora2 的发布再次引爆了视频生成领域。你可能已经看到过一些令人惊叹的演示视频,但当你自己上手时,生成的作品可能并不尽如人意。问题出在哪里?很可能就在你的**提示词(Prompt)**上。
OpenAI 官方为此发布了一份详尽的 Sora2 Prompt 指南。我们逐字逐句地研读了这份指南,为你提炼出最核心的技巧、专业术语和最佳实践,助你像专业导演一样指挥 Sora2,创造出你心目中的完美画面。
OpenAI 建议将写 Prompt 想象成给一位没看过你故事板的摄影师下达指令。
这两种方法没有对错,取决于你的目标。把 Prompt 当作一份“创意愿望清单”,而不是一份死板的合同。多尝试、多迭代是关键。即使是相同的 Prompt,每次生成的结果也会不同,这正是它的魅力所在。
在开始挥洒创意之前,有些硬性指标必须通过 API 参数设置,写在 Prompt 文字里是无效的。
model): 选择 sora-2 或 sora-2-pro。size): 直接影响画质和运动一致性。高分辨率细节更丰富,低分辨率可能会有伪影。
sora-2: 支持 1280x720, 720x1280sora-2-pro: 支持 1280x720, 720x1280, 1024x1792, 1792x1024seconds): 支持 4、8、12 秒。Sora2 在短片段中通常表现更稳定。与其强求生成一个复杂的 8 秒长镜头,不如生成两个高质量的 4 秒片段再后期拼接。你的 Prompt 文字则专注于控制主体、动作、光线和风格。
一个优秀的 Prompt 就像是在用文字绘制故事板。OpenAI 推荐的结构包括:
使用具体的名词和动词,永远比模糊形容词更有效。
想要更上一层楼?掌握以下几个维度的精细控制:
动作是最难把控的部分。秘诀是保持简单。每个镜头最好只有一个清晰的摄影机运动和一个清晰的主体动作。将动作按“节拍”描述:
灯光决定氛围。为了让不同镜头剪辑在一起时自然流畅,你需要保持灯光逻辑的一致。
摄影机的位置和运动方式决定了镜头的“感觉”。
想要锁定角色的长相、服装或特定的场景设计?使用图像输入功能。你可以先用 DALL·E 生成一张满意的静态图,然后将其作为 input_reference 喂给 Sora2。模型会以这张图为起始帧,根据你的 Prompt 让它动起来。
input_reference 参数。size) 完全匹配。Sora2 支持生成包含对话和音效的视频。
当生成结果接近但不完美时,使用 Remix 功能。它的精髓在于小步微调,而非大改。
对于追求极致电影感的用户,可以采用专业制作术语来描述镜头,就像导演给摄影和后期团队下达指令一样。这能帮助模型锁定非常具体的美学风格。
OpenAI 提供了一个结构化的 Prompt 模板,帮助你养成良好的习惯。并非所有项都必须填写,留白能给模型更多创造空间。
[用平实的语言进行散文式的场景描述。描述人物、服装、风景、天气和其他细节。尽可能描述得具体,以匹配你的愿景。]
Cinematography (摄影): Camera shot: [构图和角度,例如:广角定场镜头,视平线] Mood: [整体基调,例如:电影感且紧张,俏皮且悬疑]
Actions (动作): - [动作 1:一个清晰、具体的节拍或手势] - [动作 2:片段中的另一个清晰节拍]
Dialogue (对话): [如果有对话,在此添加简短自然的台词。保持简练以匹配视频时长。]
掌握这些技巧并不能保证一次就能生成完美视频。Sora2 的强大之处在于它愿意与你“合作”。把这份指南当作你的导演手册,开始尝试,不断迭代,去探索 Sora2 的无限可能吧!
本文内容完全参考自 OpenAI 官方文档:Sora 2 Prompting Guide