Google、Geminiの「人生成」機能を「ウェイク」問題による複数の不正確さで一時停止

Home AIニュース Google、Geminiの「人生成」機能を「ウェイク」問題による複数の不正確さで一時停止

今週、Googleの新しいAIチャットボット「Gemini」に関する論争が起こりました。具体的には、アメリカの建国父たちを黒人、Googleの創業者をアジア人として描くなど、歴史的に不正確な画像が生成されたことに対するもので、これを受けて同社は一時的に人間の画像生成機能を停止すると発表しました。Googleはユーザーの懸念に対処中であり、今後この機能を再開する計画を示しています。

テクノロジーのリーダーやライター、Geminiユーザーが共有したスクリーンショットによると、AIは歴史的正確性に関係なく多様な背景を持つ人物の画像を生成する傾向が見られます。例として、存在しない黒人カトリック教皇の生成や、ほとんどがこのようではなかった暗い肌のバイキングの描写、また、主にアジア人ではなかったナチスドイツの兵士の描写などが挙げられます。

画像生成AIモデルは偏見を排除し多様性を促進することを目指していますが、Geminiのデフォルト出力が反響を呼び、Googleの表現アプローチに対して議論が巻き起こり、広く嘲笑と批判を受けています。

この反発に応じて、Googleの製品シニアディレクターであるジャック・クラウチクは問題を認め、歴史的文脈を尊重しつつ、多様性を確保するためにモデルの改善に取り組んでいることを明言しました。「私たちのAI原則の一環として、画像生成機能はグローバルなユーザーベースを反映するように設計されており、表現と偏見を真剣に捉えています」とクラウチクは述べています。

この状況は、ユーザーや影響力のある人物からの激しい批判を呼び起こし、ベンチャーキャピタリストのマーク・アンドリーセンやポール・グレアムらも参加する議論に発展しました。これは、多様性と事実の正確性をどのようにバランスを取るかという点で、GeminiのようなAIチャットボットの信頼性に関するより広範な議論を引き起こしています。この論争は、ニューヨーク・ポストでも大きく取り上げられました。

Googleが解決策を模索している中、Geminiが批判を受けるのはこれが初めてではありません。2023年12月に「Gemini」Siriーズが発表された際、OpenAIのGPT-4と比較されるとしていたことからも、継続的な課題に直面しています。

最初の発表では、Geminiのデジタルアシスタントとしての能力を誇張した演出ビデオに対して反発がありました。また、独立した研究者によるレビューでは、GeminiがOpenAIの古いモデルGPT-3.5に比べて性能が劣っていることが示されました。

今月、GoogleはBardチャットボットをGeminiとして再ブランディングし、サブスクリプション向けに高度なバージョンを導入しました。同時に、Workspace向けに改良されたDuet AIもGeminiブランドの下で発表しました。Gemini 1.5やAdvancedが特に動画分析や文書解析において強化されるとされているものの、これらの強みは続く論争によって影が薄くなる可能性があります。

クラウチクは、不正確な画像生成などの問題を報告することが改善のために重要であると強調しました。しかし、問題が引き続き発生すれば、Geminiを競争の激しい生成AI分野のリーダーとして位置付けるGoogleの取り組みに影響を及ぼすかもしれません。

主権AI時代の到来に備える：ジェンセン・ファンインタビューからの洞察

Stable Diffusion 3.0が次世代テキストから画像へのAI生成のための革新的な拡散アーキテクチャを発表

Most people like

Veo Sports Camera

3.5M

チームスポーツ愛好者のための究極のカメラをご紹介します。感動的な試合の瞬間を捉えるもよし、パフォーマンスを分析するもよし、このカメラはスポーツ体験を次のレベルへ引き上げるために設計されています。先進的な機能と使いやすいテクノロジーを備え、アスリート、コーチ、ファンにとって完璧なツールです。

チームスポーツカメラ AI Video Recording

toby

16.3K

ますますグローバル化が進む世界では、言語を超えた効果的なコミュニケーションが不可欠となっています。多言語ビデオ通話のためのライブスピーチ翻訳は、シームレスな会話を可能にし、多様な言語的背景を持つ参加者間の協力と理解を促進します。この革新的な技術は、言語の壁を打破するだけでなく、オンライン会議やバーチャルイベントの全体的な体験を向上させます。リアルタイム翻訳機能を備えたこのツールを使用することで、ユーザーは完全に参加し、アイデアを共有し、簡単につながることができ、ビジネスや個人にとって不可欠なツールとなっています。この最先端のソリューションが、マルチリンガルな環境におけるコミュニケーションのあり方をどのように変革しているか、ぜひご覧ください。

ライブスピーチ翻訳 Translate

timeOS

49.2K

会議準備を効率化するAI駆動の新しいタブページを紹介革新的なAI搭載の新しいタブページで、生産性を高めましょう。このツールは、情報を整理し、ディスカッションを予定し、重要なリソースに簡単にアクセスするために特別に設計されています。煩雑なメモや非効率な計画にさようならを告げ、ワークフローを変革し、すべての会議を有意義にしましょう！

AI生産性アシスタント AI Notes Assistant

OpenCraft AI

9.4K

プロフェッショナル向けに設計されたAIアシスタントの力を解き放ち、生産性を向上させ、ワークフローを最適化しましょう。この革新的なツールはタスクを効率化し、あなたの仕事で本当に重要なことに集中できるようにします。専門的なアシスタントを手に入れて、新たな効率性のレベルを体験してください。

AIアシスタント AI Chatbot

Find AI tools in YBX