蘋果公司正式進入開源人工智能領域,推出了一系列創新的開源AI工具,其中核心框架為MLX,專為蘋果的Silicon架構設計。MLX在GitHub上公開,旨在優化機器學習模型的訓練與部署,特別針對蘋果硬體。
蘋果表示,MLX的設計原則受到PyTorch、Jax和ArrayFire等流行框架的啟發,但MLX以其統一內存模型脫穎而出:數組存放於共享內存中,實現所有支持的設備類型之間無需數據複製的操作,簡化工作流程並提升性能。
「該框架旨在用戶友好,同時確保模型訓練和部署的高效性。其基本設計簡單明瞭,使研究人員能輕鬆擴展和增強MLX,以快速探索新想法,」MLX的資源庫上如此說明。
MLX的主要特點
- 類似NumPy的Python API:MLX框架提供了一個與NumPy高度相似的Python API,便於熟悉該流行庫的用戶平滑過渡。此外,它還提供C++ API和基於PyTorch的高級包,讓開發者能夠構建更複雜的模型。
- 可組合函數轉換:MLX支持自動微分、自動向量化及計算圖優化,通過可組合函數轉換,簡化複雜計算任務的處理。
- 惰性計算:該框架採用惰性計算,只有在必要時才會生成數組,優化資源利用並提升效率。
- 動態圖構建:MLX可動態構建計算圖,使用者能夠在不造成緩慢編譯延遲的情況下修改函數形狀,簡化調試過程,提高整體用戶體驗。
在演示MLX功能的視頻中,蘋果機器學習研究科學家Awni Hannun展示了七十億參數版本的Meta LLaMA在M2 Ultra芯片上運行的情形,該芯片為蘋果的Mac Studio和Mac Pro這兩款高端計算系統提供動力。MLX還可應用於生成Stable Diffusion圖像、透過OpenAI的Whisper執行語音識別,以及使用LoRA實現高效的參數微調。
隨著蘋果越來越專注於人工智能,夏季有報導指出,公司也正在開發名為「Apple GPT」的網絡應用聊天機器人服務。
許可及商業使用
MLX採用MIT許可協議,為使用者提供廣泛的自由,包括商業應用。然而,用戶必須遵循許可協議的要求,在軟體的所有副本中包含版權和許可通知。
這一對開源原則的堅持,不僅表明蘋果對推進AI技術的投資,還賦能開發者、研究人員和企業在AI領域中使用其強大的工具進行創新。