使用Google的Imagen 2制作惊艳的四秒动画

谷歌推出了其图像生成模型家族的重要更新,特别是Imagen 2模型,新增了文本转动态的功能,允许用户将文本提示转换为动画图像。此外,该模型还引入了图像编辑功能,包括修复、扩展和数字水印,现在对此功能开放给普通用户使用。

在谷歌云峰会上发布的Imagen 2的文本转动态功能,能够生成每秒24帧的动画GIF,分辨率为360x640像素,持续时间为四秒。谷歌表示将持续提升此功能。

谷歌云首席执行官托马斯·库里安在新闻发布会上解释道:“用户不仅可以看到静态物体的图片,例如汽车,现在还可以看到短暂的移动车辆动画。媒体和广告行业的组织正在积极采用此技术,以提高用户参与度。”

Imagen 2能够创建多种摄影角度和运动的图像,同时确保整个动画序列的一致性。此外,该模型还结合了安全过滤器和数字水印,解决了与生成式人工智能相关的关键问题。

新的图像编辑功能使用户能够添加或移除照片中的元素,类似于Adobe Photoshop的生成填充或内容识别工具。用户还可以扩展图像边界,以获得更广阔的视野。

这些更新是谷歌对其全面管理的云AI平台Vertex AI的宣布的一部分。Imagen 2于2023年推出,由谷歌DeepMind开发,旨在从自然语言提示生成逼真的高分辨率图像。它与其他领先模型如OpenAI的DALL-E、Midjourney和Adobe Firefly展开竞争,特别用于帮助企业生产符合品牌标准和治理规范的图像。

Most people like

Find AI tools in YBX