加载中...
加载中...
Follow DataLearner WeChat for the latest AI updates

就在今日,OpenAI正式推出了 Sora 2 ——其旗舰级视频与音频生成模型。相比2024年2月发布的初代 Sora,本次升级带来了断层级的真实感与显著增强的可控性。它不仅能更好地遵循物理规律生成视频,还首次实现了同步对话与环境音效的生成,并通过全新 iOS 应用“Sora”开放给公众使用。

但遗憾的是,本次发布没有网页版,且仅在美国、加拿大地区开放,目前需要邀请码。
这一发布被许多人比喻为视频生成领域的“GPT-3.5时刻”:不仅能“看起来像”,更能“做得对”。
初代 Sora 在发布时就被称为“GPT-1 for video”——它让人第一次看到大规模训练下视频生成的雏形,甚至自然出现了“物体持久性”这类基础概念。但它的不足同样明显:
Sora 2 正是在这些关键短板上完成了突破。OpenAI 在过去一年加大了对大规模视频数据的预训练与后训练,使得模型拥有了更强的“世界模拟能力”。这意味着它能更准确地遵循物理逻辑,甚至在“失败”场景中表现合理。
例如:
这正是通向“世界模拟器”这一更宏大AI目标的关键一步。

这是Sora2生成的视频截图,可以看到浆板被压到弯曲,水花四溅,与物理世界情况基本是完全一致的。
在最新的基准评测中,Sora 2 在视频真实感方面获得了 比上一代高出72%的用户偏好率(样本量N=10,000,95%置信区间±1.5%)。
具体对比:
来自内部对比实验的结论是:Sora 2 已经能够覆盖此前模型“无法做到”的领域。这不仅体现在奥运体操、三周半跳等极限动作上,也体现在细微的生活细节,例如猫咪从桌上跳下时的重量感与落地声。
Sora 2 的关键飞跃,是把物理规律作为默认约束:惯性、摩擦、受力反馈与材质响应被更稳定地“写进了镜头”。这不仅减少了“物体变形”“瞬移补救”一类伪巧合,也让失败场景可被优雅呈现——投篮不中的回弹、桨板受力后的颠簸、羽绒服在山风中被持续拉扯的细节,都能自洽地发生。
这意味着,使用Sora 2做视频生成可以:第一,镜头可信度提高,观众更易沉浸;第二,脚本风险更低——极限动作与复杂机位不再“赌运气”,可复用与扩写的概率上升。
更重要的是它对长时间一致性的改进。Sora 2 能在多镜头与跨段落叙事中稳定维护世界状态(角色、道具、光线与天气关系的延续),这使得广告短片、品牌故事、课程演示等多场景拼接变得可靠:视频生成能在“分镜—合成—复写—再指令”这条链路上获得连续体验,不必为穿帮与前后矛盾反复返工。
与大多数视频生成工具不同,Sora 2 不再是“无声电影”。它能同时生成:
这意味着一个创作者只需输入一句提示词,就能得到完整的短片,无需再依赖额外的配音或后期制作。
例如:输入“两个极地探险家在暴风雪中喊话”,生成的视频中不仅有逼真的雪景,还能听到呼啸的风声与逐句传递的对白。
Sora 2 在可控性上的另一层含义,是把现实元素“注入”模型,即“Cameo”功能。
“Cameo”功能允许用户可以通过一次短暂的视频和音频采集,将自己或朋友的形象与声音注入模型。之后,任何场景中都能以高度保真的方式出现这一角色。
这种“你自己入镜”的交互方式,被许多测试者评价为“继文字、表情包、语音消息之后的新型沟通方式”。

上图是OpenAI将某位现实人类加入到斑马群中鼓捣音乐的场景。
遗憾的是,目前,Sora 2仅通过iOS应用开放,采取邀请制,首批仅限美国和加拿大用户使用。OpenAI 表示,未来将陆续开放网页版,并为ChatGPT Pro用户 提供更高质量的 “Sora 2 Pro” 模型。开发者也将在数月内获得 API 接入权限。
在价格方面,初期阶段免费开放,并设置较高的使用上限。后续可能会引入超额付费模式,以覆盖算力成本。
面对潜在的滥用风险,OpenAI 为 Sora 2 引入了多层安全机制:
OpenAI 强调,Sora 的推荐算法不会强化“无限滚动”,而是以“创作优先”为导向。这被视为对当下社交媒体弊病的一种回应。
这意图,明显是冲着Tiktok来的!
在视频生成赛道,Sora 2 面临 Runway、Pika Labs 等竞争对手。与竞品相比,Sora 2 的优势在于更高的物理一致性与声画同步能力,而竞品在上线速度、开放性和创作者社区方面则更具活力。
Sora 2 的出现标志着视频生成从“能做出片段”迈向“能模拟世界”。它不仅在物理真实感、声音同步和角色可控性上取得了革命性突破,更通过社交化应用探索了全新的内容消费与创作模式。
对于创作者,它是电影化表达的捷径; 对于教育和科研,它是世界模拟的工具; 对于普通用户,它是一种全新的社交沟通方式。
Sora2其它信息参考:https://www.datalearner.com/ai-models/pretrained-models/sora2