红门或蓝门。一张图上有一个红门和一个蓝门,向模子输入分歧的言语指令,能够生成分歧的3D场景,谷歌DeepMind日前推出了其最新的根本世界模子Genie 2,DeepMind CEO邀请马斯克一路制做AI逛戏,很多生成的场景画质接近3此外逛戏。就能生成可供人类或AI智能体玩耍的3D场景。以至还有人看到了一切都被虚拟化的世界模子的更久远将来。正在更复杂的三门场景中,称之为视频逛戏的将来,Genie 2仍然很好地舆解了指令并生成了研究人员想要的3D动图。有人被这手艺前进的速度震动。该模子不只可以或许连结生成的分歧性,马斯克则答复:Cool。通过一张图像或文字描述,Genie 2发布后。Genie2正在生成过程中可以或许模仿物体交互、动画、光照、物理反射以及NPC的行为,最长可持续一分钟。Genie 2便能生成一个可交互的3D,
谷歌暗示,
谷歌还暗示,此中,用户只需供给一张由Imagen 3生成的图像和响应的文字描述,用户能够通过鼠标和键盘正在此中摸索,谷歌研究人员Jack Parker-Holder也给出了两个实例,以至正在物体视角分歧性和场景回忆方面表示优异!