今週、Googleの新しいAIチャットボット「Gemini」に関する論争が起こりました。具体的には、アメリカの建国父たちを黒人、Googleの創業者をアジア人として描くなど、歴史的に不正確な画像が生成されたことに対するもので、これを受けて同社は一時的に人間の画像生成機能を停止すると発表しました。Googleはユーザーの懸念に対処中であり、今後この機能を再開する計画を示しています。
テクノロジーのリーダーやライター、Geminiユーザーが共有したスクリーンショットによると、AIは歴史的正確性に関係なく多様な背景を持つ人物の画像を生成する傾向が見られます。例として、存在しない黒人カトリック教皇の生成や、ほとんどがこのようではなかった暗い肌のバイキングの描写、また、主にアジア人ではなかったナチスドイツの兵士の描写などが挙げられます。
画像生成AIモデルは偏見を排除し多様性を促進することを目指していますが、Geminiのデフォルト出力が反響を呼び、Googleの表現アプローチに対して議論が巻き起こり、広く嘲笑と批判を受けています。
この反発に応じて、Googleの製品シニアディレクターであるジャック・クラウチクは問題を認め、歴史的文脈を尊重しつつ、多様性を確保するためにモデルの改善に取り組んでいることを明言しました。「私たちのAI原則の一環として、画像生成機能はグローバルなユーザーベースを反映するように設計されており、表現と偏見を真剣に捉えています」とクラウチクは述べています。
この状況は、ユーザーや影響力のある人物からの激しい批判を呼び起こし、ベンチャーキャピタリストのマーク・アンドリーセンやポール・グレアムらも参加する議論に発展しました。これは、多様性と事実の正確性をどのようにバランスを取るかという点で、GeminiのようなAIチャットボットの信頼性に関するより広範な議論を引き起こしています。この論争は、ニューヨーク・ポストでも大きく取り上げられました。
Googleが解決策を模索している中、Geminiが批判を受けるのはこれが初めてではありません。2023年12月に「Gemini」Siriーズが発表された際、OpenAIのGPT-4と比較されるとしていたことからも、継続的な課題に直面しています。
最初の発表では、Geminiのデジタルアシスタントとしての能力を誇張した演出ビデオに対して反発がありました。また、独立した研究者によるレビューでは、GeminiがOpenAIの古いモデルGPT-3.5に比べて性能が劣っていることが示されました。
今月、GoogleはBardチャットボットをGeminiとして再ブランディングし、サブスクリプション向けに高度なバージョンを導入しました。同時に、Workspace向けに改良されたDuet AIもGeminiブランドの下で発表しました。Gemini 1.5やAdvancedが特に動画分析や文書解析において強化されるとされているものの、これらの強みは続く論争によって影が薄くなる可能性があります。
クラウチクは、不正確な画像生成などの問題を報告することが改善のために重要であると強調しました。しかし、問題が引き続き発生すれば、Geminiを競争の激しい生成AI分野のリーダーとして位置付けるGoogleの取り組みに影響を及ぼすかもしれません。