谷歌推出新AI内容创作模型：Veo和Imagen 3深入解析

Home Hardware CN 谷歌推出新AI内容创作模型：Veo和Imagen 3深入解析

在今年的谷歌 I/O 大会上，谷歌发布了其最新的 AI 媒体创作引擎——Veo 和 Imagen 3。Veo 能够生成高质量的 1080p 视频，而 Imagen 3 则是从文本生成图像的最新框架。虽然这些产品可能不会彻底改变行业格局，但它们帮助谷歌在与 OpenAI 的 Sora 视频模型和 DALL-E 3 的竞争中保持优势。

谷歌声称，Veo 具备“对自然语言和视觉语义的深刻理解”，能够根据用户描述生成超过一分钟的视频。它还理解与电影制作和视觉技术相关的概念，例如延时摄影，这已成为 AI 视频生成模型的基本功能。

为了展示 Veo 的强大功能，谷歌与唐纳德·格洛弗及其创意工作室 Gilga 合作，制作了一则宣传视频，视频中的场景包括一场敞篷车公路旅行和帆船，均根据文字描述生成。谷歌表示，Veo 在模拟现实物理现象和呈现高清视觉效果方面超越了之前的模型。格洛弗在视频中指出：“每个人都应该成为导演；彼此讲述故事将增强我们的理解。”

尽管观众是否会接受 AI 生成的视频尚不确定——主要是出于对机器重现人类艺术的好奇心——这并没有阻止谷歌和 OpenAI 推广他们的工具。Veo 目前在谷歌的 VideoFX 工具中对部分创作者开放，未来还计划在 YouTube Shorts 等平台上推出。一旦集成到 YouTube Shorts，Veo 可能会显著提升谷歌在与 TikTok 竞争中的地位。

至于 Imagen 3，谷歌表示这是公司“最高质量”的文本生成图像模型，能够创建“逼真且生动”的图像，同时最小化伪影。与 DALL-E 3 的比较是它真正的挑战，谷歌声称 Imagen 3 在处理文本和较长提示时更智能。

此外，谷歌还与音乐艺术家 Wyclef Jean 和 Bjorn 合作测试其音乐 AI 沙盒工具，旨在协助创作歌曲和节拍。尽管目前展示的内容相对简短，但已表明一些引人注目的实例。

从日出到人类衰老，AI正变得越来越智能。谷歌最新的媒体创作工具正朝着这个方向前进。随着数十亿资金投入 AI，谷歌旨在引领下一次计算技术的突破。这些技术在增强生活或创造心灵艺术方面的未来潜力，仍然是一个值得关注的重要话题。

2023年谷歌I/O大会：重要人工智能公告全面概述

Pixel 8a首个软件更新揭秘：探索全新AI功能