Meta平台扩展AI图像生成业务
Meta平台,作为Facebook、Instagram和WhatsApp的母公司,以及领先的开源大型语言模型Llama 2的创造者,正在进一步进入文本生成图像的AI领域。
今年早些时候,Meta已在Facebook和Instagram的消息平台上推出了文本到图像和文本到贴纸的生成器。然而,本周,公司推出了名为“Imagine”的独立文本到图像AI生成器,用户可以在其消息平台之外使用它。
用户可以访问 imagine.meta.com 开始生成图像,需使用Meta、Facebook或Instagram账户登录。我尝试用Facebook登录,需创建一个新的“Meta账户”,但过程相对简单。
初期反应不一
目前,AI艺术家们正在尝试使用Meta Imagine快速生成高质量图像。有用户将其与其他流行的AI图像生成器,如Midjourney、Stable Diffusion和OpenAI的DALL-E 3进行比较。然而,初步评估显示,Imagine偶尔会生成真实的人物和建筑结构,但用户报告了诸多故障,如身体部位和风景畸形。
Imagine的界面简洁,包含一个简单的提示框和四个可供下载的生成图像。与其消息应用不同,目前没有重新混合图像的选项,且图像无法调整比例超过1:1,输入其他比例的提示也未能更改输出结果。
每个生成的图像右下角都有“Imagine”的水印及其标志。Meta发言人表示,将很快增加一个不可见水印,以增强AI生成图像的透明度和可追溯性。尽管存在这些限制,Meta仍致力于提供一种功能性且免费的替代方案,优于许多需要订阅的AI艺术生成器。
基于庞大的训练数据
Imagine依赖Meta的AI模型Emu,该模型使用了来自Facebook和Instagram的11亿张用户生成的照片进行训练。Meta确认,私信和非公开图像并未纳入训练数据。针对竞争对手的AI艺术生成器因版权问题面临审查和诉讼,Meta利用自身用户数据的策略显得既谨慎又道德,尽管该策略引发了关于用户同意的质疑。
Meta的研究人员强调,Emu的质量调优是通过相对较小的高质量图像及其相关文本数据实现的,这大大提升了生成图像的美观性,而未牺牲模型的多样性。
有趣的是,尽管Meta大力支持开源AI,目前Emu和Imagine服务都不是开源的。我们已联系公司以获取进一步说明,将提供相关更新。
Imagine的推出是Meta平台一系列更新的组成部分,带来了新AI功能,如“重新构想”功能,允许用户在Facebook Messenger和Instagram信息中根据文本提示创建新图像。