Appleの2023年ジェネレーティブAIへの取り組み
2023年のジェネレーティブAI競争において、Appleはあまり目立たない存在でしたが、着実に分野の進展を遂げています。同社はオンデバイスのジェネレーティブAIに静かに貢献しており、最近の研究論文やモデル、プログラミングライブラリは、この新興市場でのプレゼンスを強化するための戦略的な方向性を示しています。
オンデバイス推論における独自の立ち位置
AppleのジェネレーティブAIへのアプローチは、多くの競合企業とは異なります。ハイパースケーラーではないAppleは、事業モデルとしてクラウドベースの大規模言語モデル(LLM)に依存することができません。しかし、同社はオペレーティングシステムからプロセッサまで、全ての技術スタックを統制するユニークな垂直統合を実現しています。このことが、Appleにオンデバイス推論向けのジェネレーティブモデルの最適化を行う特別な位置づけをもたらしています。
最近の研究では、Appleの進展が強調されています。1月に発表された論文「LLM in a flash」では、限られたメモリを持つデバイス(スマートフォンやノートパソコン)上でLLMが効率的に動作する技術が明らかにされました。この手法では、DRAMとフラッシュメモリを戦略的に活用し、モデルの重みを動的に交換することでメモリ使用量と推論遅延を最小限に抑えています。
さらに、Appleの研究はLLMアーキテクチャの修正により、性能に大きな影響を及ぼすことなく推論計算を最大3倍削減できる可能性を示しています。このような最適化は、小型LLMを利用したアプリケーションの開発が進む中でますます重要となります。
オープンソースの取り組み
最近、Appleはいくつかのオープンソースのジェネレーティブモデルを発表しました。10月にリリースされたFerretは、7億と13億の2つのパラメータサイズを持つマルチモーダルLLMです。VicunaオープンソースLLMとLLaVAビジョン・ランゲージモデルを基にしたFerretは、入力画像の特定部分に基づいて応答を生成するユニークなメカニズムを搭載し、小さな詳細を認識する能力を示しています。この機能は、iPhoneカメラやVision Proデバイスを通じて見える物体とのユーザーインタラクションを革新する可能性があります。
また、AppleはMLLM-Guided Image Editing(MGIE)というモデルも発表しました。MGIEは、自然言語プロンプトに基づいて画像を修正でき、明るさやコントラストの変更といった広範囲の調整から特定の画像領域の修正まで対応します。この技術は今後のiOSデバイスの機能向上に寄与することでしょう。
Appleは伝統的にオープンソースの取り組みに消極的ですが、Ferretを研究目的でライセンスすることで、より活発な開発者コミュニティの育成を促進し、革新的なアプリケーションの創出を推進する可能性があります。
開発ツールの強化
12月には、Appleは機械学習モデルの開発に向けた使いやすいライブラリMLXをリリースしました。MLXは、人気のPythonライブラリであるNumPyやPyTorchに似たインターフェースを取り入れつつ、Appleプロセッサ(M2やM3)向けに最適化されています。共有メモリ技術を採用し、異なるメモリタイプを効率的に使用できるようにしています。また、このライブラリは商用利用向けにMITライセンスで提供されており、広範な採用が期待されています。
結論
Appleは、オンデバイスのジェネレーティブAI分野において大きな変革を起こすための基盤を築いています。強力な研究・エンジニアリングチームが革新を推進する準備を整えています。Appleは直接的にはGPT-4のようなモデルと競争していませんが、iPhoneやスマートウォッチなどのデバイスで次世代LLMの展開を進める能力は十分に備えています。Appleがその強みを活かし続けることで、オンデバイスのジェネレーティブAI分野への影響力は一層増すことでしょう。