AppleのAIの取り組み:Apple GPTの台頭
最近、Appleが自社のAIモデルを使用したチャットボット「Apple GPT」を開発しているという噂が広まっています。生成AI製品が急速に登場する中、Appleはこの分野での具体的な動きに対して慎重な姿勢を保っています。CEOのティム・クックは投資家に対し、生成AIが今年後半に導入されることを発表し、同社の「新たな章」を迎えると伝えました。また、AppleはGoogleやOpenAIと協力して目標を達成しようとしている可能性もあらわになってきました。
ブルームバーグによると、AppleはiPhone向けにGemini AIモデルのライセンスを取得するためにGoogleと交渉中であり、これはSamsungがGalaxy S24SiriーズにおいてGoogleのGemini Nanoモデルを活用した戦略に類似しています。具体的な契約内容は未定ですが、AppleはOpenAIとの接触も行っている模様です。OpenAIの技術はMicrosoft製品やChatGPT Plusなどにすでに統合されているため、AppleのAIの進展については期待と懸念が渦巻いています。
AppleのAI開発
2023年末までに、Appleは自社製のSiriコンチップ上で稼働するAIモデルとフレームワークを静かに導入し、Macラインナップに生成AI機能を追加しました。これはQualcommのSnapdragon X Eliteプラットフォームの取り組みに似ています。また、Appleの研究チームはGPT-4モデルを活用した静止画処理用の生成AIツール「Keyframer」に関する論文を発表しました。
別の革新的ツールは、シンプルな音声コマンドで画像編集を可能にし、Qualcommが最新のSnapdragonフラグシップチップで推進している音声アシストメディア編集ツールに似ています。ブルームバーグの報道によると、Appleは生成AI機能を評価する専門チームを強化しており、2024年までにこれらのツールを開発者に提供する予定です。
噂によれば、Appleの最初の生成AI機能は、iOS 18のリリースに伴い6月に登場する可能性があり、クラウドベースのソリューションではなく、ローカルデバイス機能に焦点を当てるとされています。
Geminiのローカル機能
Geminiは、携帯電話でローカルに動作しつつ、インターネット接続を維持しながら多様な機能を提供します。たとえば、ボイスレコーダーアプリ内での会話要約機能やオフラインでの機能もあります。さらに、Gemini NanoはGboardキーボードアプリにインテリジェントな返信機能を追加し、文脈に応じた提案やオフライン翻訳機能を提供しています。
Geminiアプリをインストールすると、ユーザーは自然言語でシームレスにやり取りし、文書やメールの要約、画像生成、シーン情報の取得、画面内容の解釈、Google MapsやGoogle Flightsを使用した旅行計画などについて支援を受けることができます。
AppleとGoogleの協力の展望
先に述べたように、SamsungがGoogleと密接に連携し、Galaxy S24SiriーズでGemini Nano AIモデルを採用したことは、Appleにも簡単に実装できる可能性があります。デバイスのライセンス交渉が失敗しても、アプリケーションを通じてGeminiが利用可能になる可能性もあります。しかし、GeminiのライセンスがiPhoneユーザーの操作を大きく変える可能性がある一方で、Siriの強化については不透明です。
現在、GoogleはGeminiをGoogle Assistantと完全に統合していません。GeminiはAndroidデバイス上でAssistantを置き換えることが可能ですが、Google Assistantは多くの日常業務にとって不可欠です。Appleの統合されたソフトウェアエコシステムを考慮すると、GeminiとSiriの役割がユーザーにとって混乱を招く可能性があります。
AppleがGoogleと協力し、GeminiをAppleエコシステムの機能と統合する独自のソリューションを開発することも考えられます。しかし、Geminiの現在のデータ保存ポリシーを考えると、深い統合が実現する可能性は疑問視されます。
Appleが直面する課題
Appleは生成AI分野で遅れをとっており、追いつくことを望んでいます。Geminiのライセンス契約は、Ajaxプロジェクトの下でAppleのAI開発が完全に実現することはないかもしれないことを示唆しており、妥協案を受け入れざるを得ないかもしれません。Geminiは強力な機能を持つ一方で、特に肌色や民族に関して画像生成において重大な不一致が指摘されています。
このような論争が広がる中、GoogleはGeminiのテキストから画像生成機能を一時停止しました。内部メモでは、GoogleのCEOがこのようなエラーが「完全に受け入れられない」と認識しています。インドでは、Geminiが政治的に敏感な発言を巡って議論を巻き起こしており、AI規制の緊急性を浮き彫りにしています。
Appleのような政府監視への慎重なアプローチで知られる企業が、Geminiをグローバルに展開することは大きなリスクを伴います。GoogleがユーザーにGeminiのエラーの可能性について警告している中、Appleはこの取り組みを慎重に評価する必要があります。