谷歌Bard升级图像生成，推出高级Gemini Pro以竞争ChatGPT

Home AI News CN 谷歌Bard升级图像生成，推出高级Gemini Pro以竞争ChatGPT

谷歌正在提升其Bard AI聊天机器人，以增强与OpenAI的ChatGPT的竞争力。在首席执行官桑达尔·皮查伊的指导下，谷歌宣布通过其自有的Imagen 2 AI模型增加图像生成能力，并推出更先进的Gemini Pro版本。这些更新使用户能更全面地使用Bard的AI功能，包括一款新的免费AI生成图像工具。

“这些更新使Bard成为一个更高效、全球可接触的AI伙伴，适用于从大型创意项目到日常活动的各种任务，”Bard的产品负责人杰克·克拉维奇在博客中表示。

此外，谷歌今天开始测试另一款名为ImageFX的图像生成工具。

Gemini Pro的多语言支持

一个多月前，谷歌推出了Gemini AI模型，包括三个版本：适用于移动应用的Nano、适用于中级应用的Pro，以及预计是目前最强大的语言模型Ultra（其能力优于GPT-4），不过Ultra版本尚未发布。

初步比较显示，Gemini Pro可能在性能上落后于OpenAI的较旧版本GPT-3.5 Turbo。这对于谷歌来说是个挑战，因为它希望在生成性AI的竞争中展示自己的实力。上个月，Gemini Pro的微调版本在Bard中上线，但仅支持英文。

今天推出的一系列新AI功能旨在帮助谷歌弥补这一差距。最新版本的Bard将支持超过40种语言——包括韩语、西班牙语、泰米尔语、意大利语和俄语——覆盖230多个国家和地区。这一扩展为更多用户提供了Gemini Pro在理解、摘要、推理和编码等方面的高级功能，同时Bard还具备通过网络搜索验证回答的能力。

Bard上的Imagen 2：与ChatGPT Plus和DALL-E 3竞争

最令人兴奋的进展是引入了基于Imagen 2模型的AI图像生成，它能够根据文本提示创建高质量的逼真图像。这使得Bard成为OpenAI的ChatGPT Plus（集成了DALL-E 3图像生成器）的直接竞争者。

“只需简单描述您想要的内容——例如‘创作一幅狗在冲浪板上骑行的图像’，Bard就会生成多种视觉效果，将您的概念变为现实，”克拉维奇解释道。

在测试中，Bard在大约30-40秒内生成图像，显示出良好的稳定性。然而，也存在未能生成图像的情况，尽管该工具遵循了过滤涉及知名人士的图像的指导方针，以避免潜在的丑闻。目前，我们的初步测试显示，工具尚不支持调整长宽比或使用非英语提示。

为了解决有关AI生成内容的版权问题，谷歌Bard允许用户报告与数据保护和版权相关的法律问题。此外，该平台对暴力、冒犯性或色情内容施加了限制。同时，谷歌通过DeepMind开发的SynthID在生成图像的像素中嵌入了数字可识别水印，帮助区分AI生成的视觉效果与人类艺术家创作的作品。

新版本功能与ImageFX

除了Bard，谷歌还在探索由Imagen 2驱动的ImageFX。现在在谷歌的实验性应用AI Test Kitchen中可用，ImageFX通过“表达芯片”鼓励创意探索，为用户提供建议并丰富他们的提示。这一功能与其他创意工具（如Ideogram）中的提供相似。

AI Test Kitchen还托管了创新项目，如MusicFX，能够根据文本提示和表达芯片创作长达70秒的旋律，以及面向歌词创作者和创意作家的TextFX。

分析选举深度伪造的加州大学伯克利分校教授：在数字时代抵制错误信息

艾伦人工智能研究所推出“真正的开源”大语言模型，推动AI发展的“关键转变”