本周,由于谷歌的新AI聊天机器人Gemini生成了历史不准确的形象(如将美国开国元勋描绘为黑人,将谷歌创始人描绘为亚洲人),引发了争议。谷歌宣布暂时停止该AI生成人物图像的功能。
谷歌表示,他们正在重视用户的关注,并计划在未来恢复这项功能。技术领袖、作家和Gemini用户分享的截图显示,该AI常常会创建来自不同背景的角色形象,而不顾历史的准确性。例如,Gemini生成了黑人的天主教教皇(尽管历史上从未出现过),将维京人描绘成肤色较深的人(而大多数维京人并非如此),以及将纳粹德国士兵描绘成亚洲人(而大多数士兵并非如此)。
尽管图像生成AI模型旨在消除偏见并促进多样性,Gemini的默认输出引发了关于谷歌如何看待 representación 的争论,导致广泛的嘲笑和批评。对此,谷歌产品高级总监Jack Krawczyk确认了问题,并指出公司正在努力优化模型,以更好地尊重历史背景,同时在如“遛狗的人”这类更广泛的提示中保持对多样性的承诺。Krawczyk表示:“作为我们AI原则的一部分,我们设计图像生成能力以反映全球用户基础,我们认真对待代表性和偏见问题。”
这一情况引发了用户和影响力人物的强烈批评,包括风险投资家Marc Andreessen和Paul Graham,关于像Gemini这样的AI聊天机器人在平衡多样性和事实准确性方面的可靠性引发了更广泛的讨论。这场争议甚至引起了主流关注,在《纽约邮报》上占据了头条。
在谷歌寻求解决方案的同时,值得注意的是,这并不是Gemini首次面临审查。自2023年12月Gemini模型系列推出以来,谷歌面临着持续的挑战,宣传其与OpenAI的GPT-4相媲美,有时甚至超越。
初始发布因一段夸大Gemini数字助理能力的宣传视频而受到批评。此外,独立研究者的评估指出,Gemini在性能上优于OpenAI的旧版模型GPT-3.5。
本月,谷歌将其Bard聊天机器人重新品牌为Gemini,并为订阅者推出了更高级的版本,同时为Workspace推出了更新的Duet AI,均以Gemini命名。尽管Gemini 1.5和Advanced承诺提供更强大的功能,特别是在视频分析和文档解析方面,但这些优势可能会被持续的争议所掩盖。
Krawczyk强调,报告像不准确图像生成这样的问题对于改进至关重要。然而,如果问题持续存在,可能会削弱谷歌让Gemini成为竞争激烈的生成AI领域领跑者的努力。