「モバイルAIの新時代」
これは、Samsungが発表予定のGalaxy S24スマートフォンSiriーズを宣伝する際に使用しているキャッチフレーズです。Samsungは、次回のUnpackedイベントで「AIによってパワーアップした全く新しいモバイル体験」を約束しています。
最近のAIブームは、ChatGPTやMidjourneyといったプラットフォームにより引き起こされており、Samsungだけではなく、スマートフォンプロセッサーの大手企業もこの流れに乗っています。QualcommとMediaTekはそれぞれ、最新のフラッグシップおよびミッドレンジチップに搭載されたデバイスでの生成AI機能を披露しています。
今後のスマートフォンマーケティングにはAIが欠かせない存在になるでしょうが、具体的にどのような価値が付加されるのでしょうか?これらの「AIによる進化」の実際の利点は明確ではなく、既存の機能が新しい名前やアプリで再包装されるだけかもしれません。
Galaxy S24Siriーズは、QualcommのSnapdragon 8 Gen 3チップを搭載しています。このチップメーカーは、Stable Diffusion技術を使用して、テキストから1秒未満で画像を生成できると主張しています。Qualcommは、Stable Diffusionをデバイスでの使用に最適化した詳細説明を提供しています。一方、MediaTekもDimensity 9300を用いてほぼ即時にテキストから画像生成を行えると主張しています。興味深いことに、既にQualcommの最新チップを搭載しているiQoo 12では、これらの生成AI機能についての言及はありません。
Samsungがテキストから画像を生成できる機能を提供した場合、その機能の実際の効果は何でしょうか?この機能が、第三者のアプリに統合されるのか、それともSamsungの独自アプリになるのかは不明です。重要なのは、日常のスマートフォン利用をどう向上させるかです。一般的なGalaxy S24ユーザーは、単純なテキストプロンプトから生成されたAI画像をどのように活用するでしょうか?会話を楽しませたり、ソーシャルメディアで話題を提供したりするかもしれません。
しかし、実際にはユーザーにはいくつかの手間がかかります。ユーザーはテキストから画像を生成し、それをローカルに保存するかクリップボードにコピーして、最終的に好みのチャットアプリに貼り付ける必要があります。理想的な解決策は、Samsungがこの画像生成をキーボードに直接統合することですが、絵文字やGIF、ステッカーだけでも近い効果が得られるのではないかとも考えられます。さらに、512 x 512ピクセルの出力解像度は、大学の課題やビジネスプレゼンテーションにおいては十分ではないかもしれません。加えて、MediaTekのデモではプレミアムオプションの料金が発生することにも言及されています。Galaxy S24ユーザーは、テキストから画像生成するトークンの制限に直面するかもしれず、設定されたクオータを超えるとパフォーマンスが低下したり、サブスクリプション料金が発生する可能性もあります。
これが真実であれば、OpenAIのDALL-Eのような他の解決策が既に利用可能であることを考えると、実用性に疑問が残ります。ユーザーは無料で画像を生成したり、ChatGPT Plusに加入して最新のDALL-E 3モデルによるスピーディかつ高品質なサービスを受けたりできます。QualcommはSnapdragon 8 Gen 3が「マルチモーダル生成AIモデルをサポートする最初のチップ」であると主張しています。これは、MetaのLlamaモデルをもとにしたネイティブチャットボットがテキスト、画像、音声による入力を受け付けることを意味しますが、このような機能は既にChatGPT-4に存在し、サブスクリプションが必要なだけです。
Qualcommが誇っているもう一つの興味深い機能は、AI画像拡張です。この機能によって、ユーザーは画像のキャンバスを任意の方向に広げられ、生成AIがユーザーのプロンプトに基づいてピクセルを知的に生成し、新しい要素をシーンに追加します。魅力的な機能ではありますが、個人の思い出が込められた写真を変えてしまうリスクもあるため、その利用には注意が必要です。
要約機能も、デバイス上での生成AIの鍵となる分野です。ユーザーが最新のニュースを追いやすくする効果が期待できますが、その使いやすさが重要です。他のアプリに切り替えることなく、ニュース記事を簡単に要約できれば、ユーザー体験は格段に向上します。
音声ベースの写真編集など、提案された他の機能は便利に思えますが、実際の価値を評価するのは難しいです。なぜなら、ワンタップのフィルターなど、既に迅速かつ満足のいく編集体験を提供する選択肢が存在するためです。また、一般的なチャット応答の生成や、通常はインターネット検索を要する質問への回答など、基本的な機能に移るにつれて再び課題が浮上します。
MetaのLlamaのようなスマートフォン上で動作する生成AIモデルは限られたリソースのため、必ずしも最も先進的ではありません。例えば、GoogleのPixel 8 Proは、Gemini Nanoと呼ばれる大規模言語モデルの基本バージョンを使用していますが、なぜ専用のモバイルアプリを通じてより強力なモデル、例えばChatGPTやPiを選択しないのでしょうか。
現時点で生成AIの最も実用的な活用法は、クラウドサービスへの依存を減少させ、オフラインでのタスクを可能にし、データプライバシーを向上させることでしょう。理想的には、これらのデバイスタイプのツールは、Googleアシスタント、Alexa、Siriなどの既存のバーチャルアシスタントとシームレスに統合されるべきです。例えば、AIアシスタントに「ギャラリーのすべての猫の画像を集めて、お父さんのためのコラージュを作って」と指示したり、「ディズニーランド旅行を計画して、最適なチケット価格と整理されたGoogleカレンダーの旅程を用意して」と依頼したりできる状況を考えてみてください。
もしデバイス上での生成AIがユーザーデータをローカルに保持できるのであれば、理論上はデータプライバシーを促進する環境が育まれるかもしれません。しかし今のところ、SamsungのAI機能の実現可能性には疑問が残ります。果たしてSamsungが意味のある生成AI体験を提供できるのか、それとも派手だが実用的ではない機能の寄せ集めで終わるのか、今後の展開が楽しみです。