谷歌Bard升级图像生成,推出高级Gemini Pro以竞争ChatGPT

谷歌正在提升其Bard AI聊天机器人,以增强与OpenAI的ChatGPT的竞争力。在首席执行官桑达尔·皮查伊的指导下,谷歌宣布通过其自有的Imagen 2 AI模型增加图像生成能力,并推出更先进的Gemini Pro版本。这些更新使用户能更全面地使用Bard的AI功能,包括一款新的免费AI生成图像工具。

“这些更新使Bard成为一个更高效、全球可接触的AI伙伴,适用于从大型创意项目到日常活动的各种任务,”Bard的产品负责人杰克·克拉维奇在博客中表示。

此外,谷歌今天开始测试另一款名为ImageFX的图像生成工具。

Gemini Pro的多语言支持

一个多月前,谷歌推出了Gemini AI模型,包括三个版本:适用于移动应用的Nano、适用于中级应用的Pro,以及预计是目前最强大的语言模型Ultra(其能力优于GPT-4),不过Ultra版本尚未发布。

初步比较显示,Gemini Pro可能在性能上落后于OpenAI的较旧版本GPT-3.5 Turbo。这对于谷歌来说是个挑战,因为它希望在生成性AI的竞争中展示自己的实力。上个月,Gemini Pro的微调版本在Bard中上线,但仅支持英文。

今天推出的一系列新AI功能旨在帮助谷歌弥补这一差距。最新版本的Bard将支持超过40种语言——包括韩语、西班牙语、泰米尔语、意大利语和俄语——覆盖230多个国家和地区。这一扩展为更多用户提供了Gemini Pro在理解、摘要、推理和编码等方面的高级功能,同时Bard还具备通过网络搜索验证回答的能力。

Bard上的Imagen 2:与ChatGPT Plus和DALL-E 3竞争

最令人兴奋的进展是引入了基于Imagen 2模型的AI图像生成,它能够根据文本提示创建高质量的逼真图像。这使得Bard成为OpenAI的ChatGPT Plus(集成了DALL-E 3图像生成器)的直接竞争者。

“只需简单描述您想要的内容——例如‘创作一幅狗在冲浪板上骑行的图像’,Bard就会生成多种视觉效果,将您的概念变为现实,”克拉维奇解释道。

在测试中,Bard在大约30-40秒内生成图像,显示出良好的稳定性。然而,也存在未能生成图像的情况,尽管该工具遵循了过滤涉及知名人士的图像的指导方针,以避免潜在的丑闻。目前,我们的初步测试显示,工具尚不支持调整长宽比或使用非英语提示。

为了解决有关AI生成内容的版权问题,谷歌Bard允许用户报告与数据保护和版权相关的法律问题。此外,该平台对暴力、冒犯性或色情内容施加了限制。同时,谷歌通过DeepMind开发的SynthID在生成图像的像素中嵌入了数字可识别水印,帮助区分AI生成的视觉效果与人类艺术家创作的作品。

新版本功能与ImageFX

除了Bard,谷歌还在探索由Imagen 2驱动的ImageFX。现在在谷歌的实验性应用AI Test Kitchen中可用,ImageFX通过“表达芯片”鼓励创意探索,为用户提供建议并丰富他们的提示。这一功能与其他创意工具(如Ideogram)中的提供相似。

AI Test Kitchen还托管了创新项目,如MusicFX,能够根据文本提示和表达芯片创作长达70秒的旋律,以及面向歌词创作者和创意作家的TextFX。

Most people like

Find AI tools in YBX