AI能力再升级从文本到视频的生成新模型发布

发布时间:2023-05-26 19:19:23 来源：黑科技

(相关资料图)

近日，人工智能在全球掀起革命浪潮，从生成文本到文本生成图像。3月21日，AI 初创公司 Runway宣布了一种新的 AI 视频生成模型，这个模型可以实现从文本到视频的转化。

据发布的资料显示，Runway 提供了一个基于网络的视频编辑器，专门用于背景移除和姿势检测等 AI 工具。该公司帮助开发了开源文本到图像模型Stable Diffusion ，并于 2 月宣布了其首个 AI 视频编辑模型 Gen-1。

Gen-1 专注于转换现有的视频片段，让用户输入粗略的 3D 动画或摇晃的智能手机剪辑并应用 AI 生成的叠加层。例如，在下面的剪辑中，硬纸板包装的镜头与工业工厂的图像配对，制作出可用于故事板或推介更精美的功能的剪辑。

相比之下，Gen-2 似乎更专注于从头开始生成视频，尽管有很多注意事项。首先，Runway 分享的演示片段短小、不稳定，而且肯定不逼真，其次，访问受限。彭博社报道称，用户必须通过 Runway 的 Discord 注册才能加入 Gen-2 的候补名单，该公司发言人 Kelsey Rondenet 告诉 The Verge，Runway将“在未来几周内提供广泛的访问权限”。

换句话说，我们现在要判断 Gen-2的只是一个演示卷轴和一些剪辑（其中大部分已经作为 Gen-1 的一部分进行广告宣传）。

去年，ChatGPT一经发布迅速爆红网络，点燃了全球对人工智能技术的新一波浪潮。上周，微软宣布正在将ChatGPT的同源技术嵌入其旗下的办公软件中，以辅助用户的工作。媒体称，它已经可以充当程序员的得力助手，未来将致力于为每一个职业都解锁类似的功能，释放更多的生产力。

这个全新的AI 视频生成模型如果表现优异，有可能将引起新一轮的热潮。此前，埃隆·马斯克将人工智能比作核技术，“它有巨大的前景也有巨大的能力，但随之而来的危险也是巨大的。”

x 广告

AI能力再升级 从文本到视频的生成新模型发布