今週、以前のTwitterであるXでテクノロジーとAIコミュニティと交流する中で、Googleの最新AIチャットボット「Gemini」の能力と限界について貴重な洞察を得ました。テクノロジーの専門家やインフルエンサー、ライターたちがGeminiとのやり取りのスクリーンショットを共有し、奇妙で不正確、歴史的に誤った画像生成に関する例を強調しています。批評家は、これらの出力が多様性や「ウィークネス」と呼ばれる考え方に偏ることが多いと主張しています。
今回の記事の公開直前、Googleの製品シニアディレクター、ジャック・クラウジック氏がXでコメントし、Geminiの歴史的画像生成の不正確さを企業が認識し、改善に向けて積極的に取り組んでいると述べました。クラウジック氏は以下のように述べています。
「Geminiが一部の歴史的画像生成において不正確な出力をしていることを認識しており、即座に修正に取り組んでいます。私たちのAIの原則の一環として、画像生成機能を我々のグローバルなユーザーベースを反映させ、表現と偏見を真剣に受け止めています。今後もオープンエンドのプロンプトに対してこれを続けます。歴史的な文脈にはより細かな配慮が必要であり、それに応じてシステムを改善していきます。ご意見ありがとうございます。引き続きお知らせください!」
Geminiは昨年、多くの期待を集めて発表され、OpenAIのGPT-4に対抗するAIモデルとして位置付けられましたが、独立した評価では旧モデルであるGPT-3.5にさえ劣っていることが示されました。その結果、Googleは今年の初めにGemini AdvancedやGemini 1.5などの新しいバージョンをリリースし、旧モデルのBardを段階的に廃止しました。
しかし、新バージョンが登場しても、Geminiは歴史的な画像生成に消極的であるとして批判を受けています。例えば、1930年代のドイツ兵士の描写や、歴史的な文脈と一致しない形でのネイティブアメリカンや肌の色が濃い人々の描写について疑問が呈されています。AIは早期のヨーロッパ文化を描く際に多様性を強調しすぎていると見受けられます。
ユーザーからは、Geminiがどうやら「ウィークネス」に基づいているとの懸念が寄せられており、この言葉はもともとアメリカにおける人種的不平等の認識から、過度に政治的に正しいとされる組織を批判するために使われることが多くなっています。
興味深いことに、一部のユーザーはGeminiの出力がリアルタイムで調整されていることに気づき、Googleが画像生成機能を積極的に改善していることを示唆しています。Googleの広報担当者は、クラウジック氏の改善への意欲を繰り返し述べ、正確な描写の必要性を認めつつ、多様性の重要性を強調しています。
Meta社のAIイニシアチブを率いるヤン・ルカン氏は、Geminiが1989年の天安門広場の抗議活動の画像生成を拒否した事例を挙げ、そのような省略がオープンソースAIの必要性を浮き彫りにしていると主張しました。
Geminiの画像生成を巡る厳しい視線は、AIが多様性や歴史的不正義、抑圧などの敏感なトピックをどう扱うべきかという大きな議論を浮上させています。Googleは過去にも、2015年にGoogleフォトにおけるアルゴリズムの偏りが問題視された事件を経験しています。また、2017年には従業員ジェームズ・ダモールがGoogleの多様性に関する実践を批判したことを理由に解雇された事例もあり、テクノロジー企業が対面する課題を示しています。
他の企業もAIによる影響に苦しんでいます。例えば、MicrosoftのAIチャットボット「Tay」は、有害で人種差別的な出力を出したため、運営を停止せざるを得ませんでした。
過去の過ちを避けようとする中で、GoogleのGeminiに対する制限的アプローチは、現代的な感覚に合わせて歴史を歪めるとして批判を受けており、ジョージ・オーウェルの『1984』における権威主義的な体制が真実を抑圧する例と比較されています。同様の批判はOpenAIのChatGPTにも向けられており、ユーザーは情報の制限を打破しようと試みています。
AI開発者は、有益なコンテンツを提供する必要性と、歴史的な不正確さを引き起こす可能性がある制約に対するユーザーからの反発とのバランスを取る厳しい立場に置かれています。この緊張は、個人の自由を許すオープンソースモデルの必要性を訴える一方で、無制限なコンテンツに伴うリスクについて懸念を募らせています。
生成AIの急増は、表現の自由と社会的に有害な行動を防ぐ必要性についての議論を一層激化させています。技術の進化とともに、その社会における影響についての議論は、今後も続くことでしょう。