到目前为止,术语“人工智能艺术”的意思是“静态图像”。不再。Meta正在展示Make-A-Video,该公司正在将人工智能艺术和插值法结合起来,创建循环的短视频GIF。
Make-A-Video.Studio目前还不能向公众开放。相反,它被展示为Meta本身可以用这项技术做什么。是的,虽然从技术上讲这是视频-从这个意义上说,有不止几帧人工智能艺术串连在一起-但它可能仍然比其他任何东西都更接近传统的GIF。
不管了。根据Meta网站上的演示,Make-A-Video实现了三个方面的目标。首先,这项技术可以拍摄两张相关的图像–无论是飞行中的水滴,还是全速奔跑的马的照片–并创建中间的画面。更令人印象深刻的是,Make-A-Video似乎能够以一种智能的方式拍摄静态图像并对其应用运动,例如,拍摄一张船只的静态图像,并创建它在波浪中移动的短视频。
最后,Make-A-Video可以把所有这些都放在一起。在一个提示“一只泰迪熊画肖像”的提示下,Meta展示了一幅动画泰迪熊画本身的小GIF。正如该公司的研究论文所指出的那样,这不仅展示了创作人工智能艺术的能力,还展示了从艺术中推断行动的能力。
Meta解释说:“Make-A-Video研究建立在文本到图像生成技术的最新进展的基础上,旨在实现文本到视频的生成。”该系统使用带有描述的图像来了解世界是什么样子的,以及它通常是如何被描述的。它还使用未贴标签的视频来了解世界是如何运动的。有了这些数据,Make-A-Video只需几个字或几行文字就能生成异想天开的、独一无二的视频,从而让你的想象力变得生动起来。
这可能意味着Meta正在对它捕获的真实视频进行算法训练。目前尚不清楚的是,这段视频是如何输入的。Facebook关于这一主题的研究论文没有指出未来视频的来源,人们不得不怀疑从Facebook捕获的匿名视频是否会被用作未来艺术的种子。
这并不是全新的,至少在概念上是这样。像VQGAN+Clip Turbo这样的动画可以接受文本提示并将其转换为动画视频,但Meta的工作似乎更复杂。然而,在模型发布供观众玩耍之前,很难说。
然而,这将人工智能艺术带入了另一个维度:运动。还需要多长时间,中途和稳定扩散才能在你的电脑上做到同样的事情?
– – END – –
– – 转载请声明来源:www.lanpanpan.com – –
编译:盼盼云笔记