GoogleがBard AIチャットボットを強化:OpenAIのChatGPTへの対抗馬
Googleは、自社のBard AIチャットボットを強化し、OpenAIのChatGPTに対抗するための新機能を発表しました。最高経営責任者のサンダー・ピチャイのもと、Googleは独自のImagen 2 AIモデルを用いて画像生成機能を追加し、さらに進化したGemini Proのバージョンを提供します。
これにより、ユーザーはBardのAI機能により広範なアクセスが可能となり、AIが生成した画像を作るための無料ツールも追加されました。Bardのプロダクトリードであるジャック・クラクズィックは、「これらのアップデートにより、Bardは大規模な創造的プロジェクトから日常のタスクまでをサポートする、より効率的で国際的なAIパートナーとなる」とブログで述べています。
Gemini Proの多言語対応
Googleは1か月以上前にGemini AIモデルを、モバイル向けのNano、中間的なアプリケーション向けのPro、そして最も強力な言語モデルであるUltraの3つのバージョンで発表しました。Ultraバージョンは今年後半にリリース予定ですが、初期の比較ではGemini ProはOpenAIの旧モデルであるGPT-3.5 Turboに遅れをとっていることが示唆されています。この点が、Googleにとって生成AIの競争環境での実力をアピールするうえでの課題となっています。
Gemini Proの精密調整版は先月Bardでリリースされましたが、当初は英語のみの対応でした。本日の新機能の導入により、Bardは40以上の言語(韓国語、スペイン語、タミル語、イタリア語、ロシア語など)をサポートし、230か国以上で利用可能になります。これにより、Gemini Proの先進的な理解、要約、推論、コーディング能力へのアクセスがより多くのユーザーに提供されることになります。
Imagen 2による画像生成:ChatGPT PlusとDALL-E 3に挑戦
特に注目されるのは、Imagen 2モデルを用いたAIによる画像生成機能の追加です。この機能により、BardはOpenAIのChatGPT Plus、特にDALL-E 3の直接の競争相手となります。クラクズィックは、「単に『サーフボードに乗った犬の画像を作成して』と説明すれば、Bardがさまざまなビジュアルを生成してアイデアを具現化します」と語りました。
テスト中、Bardは約30~40秒で画像を生成し、一貫した品質を示しました。しかし、ガイドラインに従っても、著名人の画像生成ができないなどの問題もありました。初期テストでは、アスペクト比を変更したり、英語以外のプロンプトを使用することはできませんでした。
著作権に関する懸念への対処
AIが生成したメディアに関する著作権の懸念にも対処しており、ユーザーは生成されたコンテンツに対するデータ保護や著作権の法律問題を報告できます。また、暴力的、攻撃的、または性的に露骨なコンテンツに制限を設けています。さらに、GoogleはDeepMindが開発したSynthIDを使用して、生成された画像にデジタル識別可能な透かしを埋め込み、AI生成のビジュアルと人間のアーティストによって作成されたビジュアルを区別します。
ImageFXを活用した新機能
Bardに加え、GoogleはImagen 2を用いたImageFXの開発も進めています。現在、Googleの実験的アプリ「AI Test Kitchen」で利用可能なImageFXは、ユーザーに提案を提供する「表現チップ」を通じて創造的な探求を促します。この機能は、他のクリエイティブツールで見られる機能に似ています。
AI Test Kitchenでは、テキストプロンプトと表現チップを用いて最大70秒の曲を作成できるMusicFXや、作詞家やクリエイティブライター向けのTextFXといった革新的なプロジェクトもホスティングしています。