Meta 最新人工智能突破:Emu Video 与 Emu Edit 重塑文本转视频创作与图像编辑体验

Meta(脸书和Instagram的母公司)在人工智能(AI)内容创建和编辑工具方面取得了显著进展,推出了两个新功能:Emu Edit(图像编辑)和Emu Video(视频生成)。这两款工具是Meta于九月宣布的Expressive Media Universe(Emu)项目的一部分,标志着公司向更直观和创造性的社交应用功能迈进。

Emu Edit:提升图像编辑体验

Emu Edit通过文本指令为用户提供先进的图像编辑控制,类似于Adobe Photoshop中的“生成填充”功能。该工具在局部和全局编辑、背景修改、颜色和几何转换、物体识别和细分方面表现出色。重要的是,Emu Edit确保修改仅限于相关区域,保持不相关像素的完整性。Meta的研究人员强调,“关注点应限于编辑请求相关的像素变化。”

该工具经过10百万合成样本的大规模数据集训练,能够生成高质量结果。例如,用户可以输入“你好!”加入到一顶棒球帽的图片中,Emu Edit将添加文字而不改变帽子的本身。

Emu Video:简化文本到视频的生成

与图像编辑相辅相成,Emu Video工具利用扩散模型简化视频生成。它可以根据多种输入类型生成视频,包括仅文本、仅图像或两者结合。该过程首先根据文本提示创建图像,然后根据该图像和额外的文本提示生成视频。想要亲身体验,可以查看Emu Video的现场演示。

改变内容创作方式

这些进展将彻底改变用户在社交媒体上与图像和视频的互动,使用户能够创建动画贴纸、GIF或照片编辑,无需复杂的软件如Photoshop。然而,这两个工具目前仍在开发中,未确定发布日期。

Emu支持的工具与Meta在生成AI方面的更广泛战略相一致,补充了现有项目如Make-A-Video和AI图像生成器DALL-E。Meta的目标是通过提供直观的功能来提升用户创造力,拓展艺术可能性。

加强Meta的生态系统

Emu Video和Emu Edit的推出反映了Meta持续增强应用互动的战略,促进用户在社交生态系统内的更深入的整合。虽然这些工具承诺能增加创造力,但也提出了关于AI伦理和内容监督的重要问题。与其他生成模型一样,Emu需要建立保护措施以防止潜在的滥用,这是Meta在快速发展的AI环境中高度重视的优先事项。

目前,Emu Video和Emu Edit仍处于开发中,尚无公开发布的时间表。然而,Meta在生成AI领域的积极研究表明,变革性的社交媒体体验即将到来,用户可能能够以发送短信的简单方式创建专业级内容。

Most people like

Find AI tools in YBX