2024年のモバイルワールドコングレス(MWC)で、QualcommはSnapdragonSiriーズチップのAI機能の大幅な進化を発表しました。このデモでは、音声によるメディア編集、デバイス上での画像生成、Meta社の大規模言語モデル(LLM)を活用したインテリジェントなバーチャルアシスタントなど、多彩な革新的なAIアプリケーションが紹介されました。
Qualcommの特に注目すべき機能は、スマートフォン上で直接動作する大規模言語・ビジョンアシスタント(LLaVa)です。このアシスタントは、ChatGPTに似た会話能力とGoogle Lensの画像処理機能を組み合わせています。ユーザーは、料理の盛り付けの画像をアップロードし、その内容について質問することができます。このAIアシスタントは、70億以上のパラメーターを持つマルチモーダルモデルを活用し、果物、チーズ、肉、ナッツなどの食材を特定します。
特筆すべきは、このアシスタントが画像入力と継続的な対話の両方をサポートしていることで、全体的なユーザー体験が向上します。OpenAIのChatGPTやCopilotとは異なり、Qualcommのソリューションはデバイス内でデータを処理するため、応答時間が短縮され、プライバシーが向上します。Qualcommは、このLLaVaベースのバーチャルアシスタントがユーザーのプライバシー、信頼性、個別化を強化すると強調しています。
さらに、QualcommはLoRA(Low-Rank Adaptation)技術を基にした画像生成機能も紹介しました。このアプローチは、従来の生成AIツール(DALL·Eなど)とは異なり、モデルパラメーターを削減することによりトレーニングプロセスを最適化しています。この最適化により、メモリ要件が低くなり、処理速度が向上し、LoRAはモバイルデバイスにとってより効率的な選択肢となります。
また、Qualcommは、画像の拡張領域を補完するための生成AIや、既にSamsung Galaxy S24 Ultraに実装されているAI生成動画機能など、他のAI機能についても強調しました。MWC 2024でのQualcommの展示は、スマートフォンAI技術における同社のリーダーシップを示し、業界はこれらの革新がモバイルユーザー体験をどのように変えるか注目しています。