谷歌发布Genie 3:一个可以生成720P开启实时交互式虚拟世界生成新纪元
谷歌DeepMind发布了一个全新的大模型——Genie 3,这是一个能够根据文本描述生成多样化、可实时交互虚拟世界的通用世界模型。目前,Genie3可以生成几分钟的720P的视频,且每秒24帧左右。用户也可以在生成的视频中实时交互控制。从谷歌官方的视频看,这个Genie 3模型生成的视频和游戏世界的质量很高,非常令人心动!

什么是世界模型?
在深入了解Genie 3之前,我们首先需要理解“世界模型”(World Model)的概念。世界模型是一种特殊的人工智能系统,它能利用其对世界的理解来模拟世界的方方面面。 这意味着模型不仅可以预测环境将如何演变,还能预见个体的行为将对环境产生何种影响。
简单来说,世界模型是一种能够理解和模拟现实世界动态的生成式人工智能模型,不单单是生成一个视频,但是会理解物理世界的客观规律,例如重力的影响、吃饭的动作等。
世界模型被视为通向通用人工智能(AGI)的关键基石之一,因为它使得在一个无限丰富的模拟环境中训练AI代理(agent)成为可能。




