Meta 最新人工智能突破：Emu Video 与 Emu Edit 重塑文本转视频创作与图像编辑体验

Home AI News CN Meta 最新人工智能突破：Emu Video 与 Emu Edit 重塑文本转视频创作与图像编辑体验

Updated on 十一月 16 2023

Meta（脸书和Instagram的母公司）在人工智能（AI）内容创建和编辑工具方面取得了显著进展，推出了两个新功能：Emu Edit（图像编辑）和Emu Video（视频生成）。这两款工具是Meta于九月宣布的Expressive Media Universe（Emu）项目的一部分，标志着公司向更直观和创造性的社交应用功能迈进。

Emu Edit：提升图像编辑体验

Emu Edit通过文本指令为用户提供先进的图像编辑控制，类似于Adobe Photoshop中的“生成填充”功能。该工具在局部和全局编辑、背景修改、颜色和几何转换、物体识别和细分方面表现出色。重要的是，Emu Edit确保修改仅限于相关区域，保持不相关像素的完整性。Meta的研究人员强调，“关注点应限于编辑请求相关的像素变化。”

该工具经过10百万合成样本的大规模数据集训练，能够生成高质量结果。例如，用户可以输入“你好！”加入到一顶棒球帽的图片中，Emu Edit将添加文字而不改变帽子的本身。

Emu Video：简化文本到视频的生成

与图像编辑相辅相成，Emu Video工具利用扩散模型简化视频生成。它可以根据多种输入类型生成视频，包括仅文本、仅图像或两者结合。该过程首先根据文本提示创建图像，然后根据该图像和额外的文本提示生成视频。想要亲身体验，可以查看Emu Video的现场演示。

改变内容创作方式

这些进展将彻底改变用户在社交媒体上与图像和视频的互动，使用户能够创建动画贴纸、GIF或照片编辑，无需复杂的软件如Photoshop。然而，这两个工具目前仍在开发中，未确定发布日期。

Emu支持的工具与Meta在生成AI方面的更广泛战略相一致，补充了现有项目如Make-A-Video和AI图像生成器DALL-E。Meta的目标是通过提供直观的功能来提升用户创造力，拓展艺术可能性。

加强Meta的生态系统

Emu Video和Emu Edit的推出反映了Meta持续增强应用互动的战略，促进用户在社交生态系统内的更深入的整合。虽然这些工具承诺能增加创造力，但也提出了关于AI伦理和内容监督的重要问题。与其他生成模型一样，Emu需要建立保护措施以防止潜在的滥用，这是Meta在快速发展的AI环境中高度重视的优先事项。

目前，Emu Video和Emu Edit仍处于开发中，尚无公开发布的时间表。然而，Meta在生成AI领域的积极研究表明，变革性的社交媒体体验即将到来，用户可能能够以发送短信的简单方式创建专业级内容。

迈向通用人工智能：DeepMind对我们当前进展的深刻见解

谷歌DeepMind推出Lyria：颠覆音乐创作的尖端生成AI模型