蘋果在2023年生成式人工智慧領域的角色
儘管蘋果在2023年的生成式人工智慧競賽中較不顯眼,但其在該領域的重大進展不容忽視,持續為設備端生成式AI做出貢獻。近期蘋果的研究論文、模型和程式庫顯示出其在這一新興市場中增強存在感的戰略方向。
獨特的設備端推論定位
蘋果的生成式AI策略與許多競爭對手截然不同。因其並非超大規模的運營商,蘋果無法基於雲端大型語言模型(LLMs)為商業模式。然而,其擁有無與倫比的垂直整合能力——從操作系統到處理器,控制整個技術堆棧。這使蘋果在優化設備端推論的生成式模型方面具備獨特優勢。
近期的研究凸顯了蘋果的進步。2023年1月發表的論文《快速的LLM》揭示了一種可以使LLM在內存有限的設備(如智能手機和筆記本電腦)上高效運行的技術。這種方法巧妙地利用了DRAM和閃存,動態調整模型權重,以最小化內存使用和推論延遲,特別是在蘋果的自家晶片上。
在此之前,蘋果的研究顯示,透過改造LLM架構,推論計算可減少多達三倍而性能損耗極小。隨著開發者創建能在消費者設備上運行的小型LLMs,此類優化顯得尤為重要,因為即使是微小的延遲也可能影響整體用戶體驗。
開源計劃
近期,蘋果發布了幾個開源生成式模型,其中包括10月推出的Ferret。Ferret是一個多模態LLM,設計有兩種參數大小:70億和130億。基於Vicuna開源LLM和LLaVA視覺語言模型構建,Ferret具有根據特定輸入圖像部分生成回應的獨特機制,展現出對小細節的辨識能力。此能力有望改變用戶通過iPhone相機或Vision Pro設備與物體的互動方式。
此外,蘋果還推出了基於自然語言提示修改圖像的模型MLLM-Guided Image Editing (MGIE)。MGIE能進行廣泛調整(如亮度和對比度變化),以及針對特定圖像區域的精準修改,增強未來iOS設備的功能。
雖然蘋果傳統上對開源計劃較為保守,但Ferret的研究用許可將有助於激發更活躍的開發者社群,促進創新應用。
增強的軟體開發工具
在12月,蘋果發布了MLX,一個便於機器學習模型開發的使用者友好庫。MLX採納了類似於流行Python庫(如NumPy和PyTorch)的熟悉界面,同時針對蘋果的M2和M3處理器做了性能優化。它採用了“共享內存”技術,使ML模型能夠高效利用不同類型的內存。
該庫的設計簡化了開發者將現有庫中的代碼轉移至蘋果環境的過程,並已在MIT許可下提供商業使用,促進更廣泛的採用。
結論
這一發展路徑表明,蘋果正在為設備端生成式AI的顯著變化奠定基礎,並擁有強大的研究和工程團隊隨時準備創新。雖然蘋果可能不會與GPT-4等模型直接競爭,但其完全有能力推動下一波LLMs在iPhone和智能手錶等設備上的應用。隨著蘋果不斷利用其優勢,其在設備端生成式人工智慧領域的影響力有望顯著增長。