苹果公司正式进军开源人工智能领域,推出了一系列创新的开源AI工具。该系列的核心是MLX框架,特别针对苹果Silicon架构进行了精心设计。MLX已在GitHub上公开,旨在优化在苹果硬件上训练和部署机器学习模型的过程。
苹果公司表示,MLX的设计原则受到流行框架(如PyTorch、Jax和ArrayFire)的启发,但其独特之处在于统一内存模型:数组存储在共享内存中,使得所有支持的设备类型之间的操作无需数据复制。这一特性简化了工作流程,提高了性能。
MLX库中阐述了其目标:“该框架旨在用户友好,同时确保高效的模型训练和部署。其基本设计简单明了,使得研究人员可以轻松扩展和增强MLX,以快速探索新想法。”
MLX的关键特点:
- 与NumPy相似的Python API:MLX框架提供了一个与NumPy非常相似的Python API,使熟悉这个流行库的用户能顺利过渡。此外,还提供了C++ API和基于PyTorch设计的高级包,以帮助开发者构建更复杂的模型。
- 可组合的函数转换:MLX支持自动微分、自动向量化和计算图优化,通过可组合的函数转换,简化复杂计算任务的处理。
- 惰性计算:该框架采用惰性计算,数组仅在必要时才会被生成。这一特性优化了资源利用率,提高了效率。
- 动态图构建:MLX动态构建计算图,用户可以在不造成编译延迟的情况下修改函数形状,从而简化调试过程,提高整体用户体验。
在演示MLX能力的视频中,苹果机器学习研究科学家Awni Hannun展示了在M2 Ultra芯片(为Mac Studio和Mac Pro提供动力)上运行的七十亿参数版本的Meta LLaMA。MLX的其他显著应用还包括利用Stable Diffusion生成图像、通过OpenAI的Whisper进行语音识别,以及使用LoRA实现参数高效的细调。
随着苹果越来越专注于人工智能,近期的报告表明,该公司还在开发名为“Apple GPT”的基于网络应用的聊天机器人服务。
许可与商业使用
MLX在MIT许可下提供,允许广泛的使用,包括商业应用。不过,用户必须遵守许可要求,在软件的所有副本中包含版权和许可声明。
这一对开源原则的承诺不仅展示了苹果在推动人工智能技术方面的投入,还赋予了开发者、研究人员和企业在使用其强大工具进行创新的自由。