Appleの世界開発者会議(WWDC)が近づくにつれ、同社の人工知能(AI)に関する進展がますます注目されています。スマートフォンやコンピューティング分野では、競合他社がAIのトレンドに積極的に取り組む中、Appleは慎重な姿勢を示しており、この急速に進化する市場で遅れを取っているのではないかとの懸念が高まっています。
しかし、最近の報告では、特に今年後半に予定されているiOS 18のアップデートに関して、AppleのAIに対する戦略的ビジョンが明らかになっています。AppleはAI分野に深く関与しているようですが、競合他社とは異なるアプローチを採っています。ブルームバーグによれば、Appleは「生成AI機能の基盤を形成する大規模言語モデルを開発しており、その運用は完全にデバイス上で行うことになる」とされています。つまり、この技術はクラウドコンピューティングに依存せず、iPhoneのプロセッサを利用することになります。
内部プロジェクトとして「AppleGPT」に関する噂が流れていますが、AppleはGoogleやOpenAIと提携したMicrosoftのツール、例えばChatGPTやCopilot、Geminiと同等の洗練されたレベルには達していないようです。このため、Appleは最近、GoogleからGemini AIのライセンスを取得することを検討しているという報道があり、これはSamsungやOnePlusが行った手法に似ています。生成AIツールは、多くのデータセットに基づいているものの、初期段階では大きな課題に直面することが多く、例えばGoogleはGemini AIのテキストから画像への機能でトラブルに直面し、批判を受けました。さらに、MetaのAIも注目を集めています。また、著作権法、公正開示、トレーニングの透明性を巡る議論も、Appleが慎重に対処したい分野の一つです。
競合他社がAIの能力を過剰に宣伝する中、Appleはより落ち着いたアプローチを取る意向です。ブルームバーグの報告によれば、「チャットボットや他の生成AIツールを強調するのではなく、Appleはこの技術が日常生活をどのように向上させるかを示すことを目指しています」とのことです。
ChatGPTの登場以来、市場にはリアルな画像生成や音声クローン、テキストからのフォトリアルな動画生成など、多様なAIソリューションが爆発的に増加しています。しかし、これらの華やかなツールが、一般ユーザーの日常シナリオでどれだけ役立つかという重要な質問が残ります。
それにもかかわらず、AppleはAI競争において独自のアイデンティティを確立する決意を示しています。最近、同社はMGIEというAIツールに関する研究論文をいくつか公開し、音声命令によるメディア編集をサポートしています。また、MM1というマルチモーダル大規模言語モデルに関する論文もあり、これは「コンテキスト内学習の強化とマルチ画像推論」を約束しています。
別のAppleの研究では、AIが画面上のコンテンツを解釈し、ユーザーをサポートする能力について検討されていました。あるAppleのエンジニアは、同社がGoogleのGemini AIモデルなどの競合と比較してどのような進展を遂げているかについて、次のように述べています。「これは始まりに過ぎません。チームはすでに次世代モデルに取り組んでいます。このプロジェクトに貢献してくれた皆さんに心から感謝します!」(ブランダン・マッキンジー)
他の研究論文では、プライバシーとセキュリティに対するAIの影響についても取り上げられており、これはAppleの核となる価値観と合致しています。前述のデバイス上での処理方式は、AIによって処理されたデータがiPhoneに留まり、クラウドサーバーに送信されないことを保証し、このアプローチは人とAIの相互作用の効率性を高めます。
さらに、Appleはこのような革新に必要なハードウェアを備えています。2017年から、同社のiPhoneにはニューラルプロセッシングユニット(NPU)が搭載されており、専用のAIアクセラレーターとして機能しています。この技術はGoogleのテンソル処理ユニット(TPU)に似ており、現在Geminiモデルをデバイス上で実行する能力を持っています。Appleはこの取り組みの基盤を築いてきたことが明らかです。
WWDC 2022では、Appleが「生成AIの基盤技術であるTransformerアーキテクチャのオープンソース参考実装」を導入しました。最近のブルームバーグの報告によれば、Appleは2024年6月に開かれるWWDCでAI戦略を発表する予定です。デバイス上での生成AIモデルは、Siriの機能を向上させる可能性があるのでしょうか?その答えは時間が教えてくれるでしょう。