(相关资料图)
近日,人工智能在全球掀起革命浪潮,从生成文本到文本生成图像。3月21日,AI 初创公司 Runway宣布了一种新的 AI 视频生成模型,这个模型可以实现从文本到视频的转化。
据发布的资料显示,Runway 提供了一个基于网络的视频编辑器,专门用于背景移除和姿势检测等 AI 工具。该公司帮助开发了开源文本到图像模型Stable Diffusion ,并于 2 月宣布了其首个 AI 视频编辑模型 Gen-1。
Gen-1 专注于转换现有的视频片段,让用户输入粗略的 3D 动画或摇晃的智能手机剪辑并应用 AI 生成的叠加层。例如,在下面的剪辑中,硬纸板包装的镜头与工业工厂的图像配对,制作出可用于故事板或推介更精美的功能的剪辑。
相比之下,Gen-2 似乎更专注于从头开始生成视频,尽管有很多注意事项。首先,Runway 分享的演示片段短小、不稳定,而且肯定不逼真,其次,访问受限。彭博社报道称,用户必须通过 Runway 的 Discord 注册才能加入 Gen-2 的候补名单,该公司发言人 Kelsey Rondenet 告诉 The Verge,Runway将“在未来几周内提供广泛的访问权限”。
换句话说,我们现在要判断 Gen-2的只是一个演示卷轴和一些剪辑(其中大部分已经作为 Gen-1 的一部分进行广告宣传)。
去年,ChatGPT一经发布迅速爆红网络,点燃了全球对人工智能技术的新一波浪潮。上周,微软宣布正在将ChatGPT的同源技术嵌入其旗下的办公软件中,以辅助用户的工作。媒体称,它已经可以充当程序员的得力助手,未来将致力于为每一个职业都解锁类似的功能,释放更多的生产力。
这个全新的AI 视频生成模型如果表现优异,有可能将引起新一轮的热潮。此前,埃隆·马斯克将人工智能比作核技术,“它有巨大的前景也有巨大的能力,但随之而来的危险也是巨大的。”