Googleは、ユーザーが自然言語プロンプトを使ってアプリケーションを作成できる革命的なツールを備えたウェブ開発プラットフォームの拡張を計画しています。最近、JavaScriptエンジニアのベドロス・パンブキアン氏は、MakerSuiteの新しいAI機能のスクリーンショットを共有しました。なかでも注目すべきは、GeminiというマルチモーダルAIモデルです。これは、テキスト、画像、音声の入力および出力を可能にし、高い期待が寄せられています。現段階ではこれらの機能は公に確認されていませんが、初期のスクリーンショットからは、いくつかのインターフェース要素が未完成のようであることが示唆されています。
明らかになったこと
漏洩した機能の中には、Stubbsと呼ばれる特筆すべきツールがあります。Stubbsは、AI生成のアプリプロトタイプを簡単に作成・共有するために設計されており、技術的な知識を持たない人でも直感的に使えることを目指しています。また、Stubbs Galleryという機能もあり、MakerSuiteのユーザーが既存のプロトタイプを探索・修正できるようになります。特に、ユーザーが作成したStubbsはデフォルトでプライベートに保たれますが、他者と共有するオプションも用意されています。
Geminiは、MakerSuiteの統合のために「Jetway」としても知られており、このプラットフォームのマルチモーダル機能を推進することが期待されています。テキスト認識、物体認識、画像の文脈理解、さらにプロンプトにビデオやHTMLを組み込む能力を含みます。エンジニアによると、GeminiはGoogleのアプリケーション開発環境であるVertex AIにも統合される予定です。
追加の機能
新たに追加される機能には、MakerSuiteの自動保存機能、さまざまな言語でのプロンプト翻訳サポート、画像やファイルを編集環境にシームレスにインポートできるGoogle Driveとの統合が含まれます。
Google Gemini: 洞察と期待
Googleは、今年5月のI/OイベントでGeminiを発表以来、そのマルチモーダル機能を予告しています。CEOのサンダー・ピチャイ氏は、これまでのモデルに比べて著しく進化した機能を強調しました。Geminiプロジェクトは、Google DeepMindチームによって開発されており、Brain TeamとDeepMindの専門知識を結集して、OpenAIのChatGPTなど業界のリーダーに対抗する堅実な競争相手を提供します。
詳細は限られていますが、Geminiのマルチモーダル機能が確認されており、テキスト、動画、画像の応答の処理と生成が可能です。また、機能を拡張するためにさまざまなツールやAPIにアクセスする設計がなされています。
より簡単なアプリ開発の促進
AIを活用したウェブアプリ開発への関心が高まっており、GoogleはProject IDXという新しい開発環境を導入してこの目標を推進しています。この取り組みは、MetaGPTやGitHub Copilotなどのツールと連携し、自然言語処理を通じたアプリケーションの構築を容易にします。
最近、元Googleのエンジニアが、クラウドインフラに依存せずにAI搭載のウェブアプリをローカルデバイス上で構築するための革新的なアプローチを紹介しました。Stubbsが実際に追加された場合、アプリ開発へのアクセスが大幅に民主化される可能性があると、AIとデータ分析のチーフアナリストであるブラッドリー・シミン氏は述べています。
テクノロジーのリーク事情
パンブキアン氏のブログ投稿に含まれる情報は、まだGoogleによって公式に確認されていない点に注意が必要です。スクリーンショットの出所は不明ですが、パンブキアン氏は外部ソースの影響を受けずに直接取得したと述べています。歴史的に見て、開発者は未公開機能を発見することに長けており、例えば6月には、開発者がMetaのCEOマーク・ザッカーバーグによるConnect 2023イベントでの公式発表の3ヶ月前に、InstagramのAIチャットボット計画を明らかにしました。
Googleがこれらの可能性を秘めた機能を展開する中、テクノロジーコミュニティは、アプリ作成の未来を形作るさらなる進展を切望しています。