谷歌推出新AI内容创作模型:Veo和Imagen 3深入解析

在今年的谷歌 I/O 大会上,谷歌发布了其最新的 AI 媒体创作引擎——Veo 和 Imagen 3。Veo 能够生成高质量的 1080p 视频,而 Imagen 3 则是从文本生成图像的最新框架。虽然这些产品可能不会彻底改变行业格局,但它们帮助谷歌在与 OpenAI 的 Sora 视频模型和 DALL-E 3 的竞争中保持优势。

谷歌声称,Veo 具备“对自然语言和视觉语义的深刻理解”,能够根据用户描述生成超过一分钟的视频。它还理解与电影制作和视觉技术相关的概念,例如延时摄影,这已成为 AI 视频生成模型的基本功能。

为了展示 Veo 的强大功能,谷歌与唐纳德·格洛弗及其创意工作室 Gilga 合作,制作了一则宣传视频,视频中的场景包括一场敞篷车公路旅行和帆船,均根据文字描述生成。谷歌表示,Veo 在模拟现实物理现象和呈现高清视觉效果方面超越了之前的模型。格洛弗在视频中指出:“每个人都应该成为导演;彼此讲述故事将增强我们的理解。”

尽管观众是否会接受 AI 生成的视频尚不确定——主要是出于对机器重现人类艺术的好奇心——这并没有阻止谷歌和 OpenAI 推广他们的工具。Veo 目前在谷歌的 VideoFX 工具中对部分创作者开放,未来还计划在 YouTube Shorts 等平台上推出。一旦集成到 YouTube Shorts,Veo 可能会显著提升谷歌在与 TikTok 竞争中的地位。

至于 Imagen 3,谷歌表示这是公司“最高质量”的文本生成图像模型,能够创建“逼真且生动”的图像,同时最小化伪影。与 DALL-E 3 的比较是它真正的挑战,谷歌声称 Imagen 3 在处理文本和较长提示时更智能。

此外,谷歌还与音乐艺术家 Wyclef Jean 和 Bjorn 合作测试其音乐 AI 沙盒工具,旨在协助创作歌曲和节拍。尽管目前展示的内容相对简短,但已表明一些引人注目的实例。

从日出到人类衰老,AI正变得越来越智能。谷歌最新的媒体创作工具正朝着这个方向前进。随着数十亿资金投入 AI,谷歌旨在引领下一次计算技术的突破。这些技术在增强生活或创造心灵艺术方面的未来潜力,仍然是一个值得关注的重要话题。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles