谷歌 DeepMind 公布能生成可互动环境的世界模型 Genie 2
谷歌 DeepMind 推出第二代 Genie 模型,其可以根据单个图像和文本描述生成交互式实时 3D 世界场景。以 Genie 世界模型作为基础模型,可以为自动驾驶或具身人工智能生成无限多的训练数据,进一步推动 AI 发展。
Genie 2 可以生成“丰富多样的 3D 世界”,其中包括用户可以使用鼠标或键盘进行跳跃和游泳等动作的世界。该模型经过视频训练,能够模拟物体交互、动画、灯光、物理、反射和“NPC”的行为,并拥有记忆能力。在谷歌公布大量示例中,许多看起来都像 3A 游戏,原因很可能是该模型的训练数据包含热门游戏的通关视频。
—— TechCrunch,Google 博客
发表回复