Apple ha ingressado en el ámbito de la inteligencia artificial de código abierto con el lanzamiento de su innovadora suite de herramientas. En el centro de esta presentación se encuentra el framework MLX, diseñado específicamente para la arquitectura de Silicon de Apple. Disponible en GitHub, MLX está destinado a optimizar el entrenamiento y la implementación de modelos de aprendizaje automático en el hardware de Apple.
Apple describe los principios de diseño de MLX como "inspirados" en marcos populares como PyTorch, Jax y ArrayFire. Sin embargo, MLX se distingue por su modelo de memoria unificado: los arreglos residen en memoria compartida, lo que posibilita operaciones en todos los tipos de dispositivos compatibles sin necesidad de copiar datos. Esta característica agiliza los flujos de trabajo y mejora el rendimiento.
"El framework busca ser fácil de usar mientras asegura un entrenamiento y despliegue eficiente de modelos. Su diseño fundamental es sencillo, permitiendo a los investigadores extender y mejorar MLX fácilmente para explorar nuevas ideas rápidamente", se señala en el repositorio de MLX.
Características Clave de MLX
- API de Python Similar a NumPy: El framework MLX incluye una API de Python que se asemeja a NumPy, facilitando una transición suave para los usuarios familiarizados con esta popular biblioteca. Además, ofrece una API de C++ y paquetes de alto nivel modelados según PyTorch, permitiendo a los desarrolladores construir modelos más sofisticados.
- Transformaciones de Función Compuestas: MLX admite diferenciación automática, vectorización automática y optimización de gráficos computacionales a través de transformaciones de función compuestas, lo que simplifica el manejo de tareas computacionales complejas.
- Cálculo Perezoso: El framework emplea cálculo perezoso, lo que significa que los arreglos se materializan solo cuando es necesario. Esta característica optimiza la utilización de recursos y mejora la eficiencia.
- Construcción Dinámica de Grafos: MLX construye gráficos computacionales de manera dinámica. Los usuarios pueden modificar las formas de las funciones sin experimentar retrasos por compilaciones lentas, agilizando el proceso de depuración y mejorando la experiencia del usuario.
En una demostración de las capacidades de MLX, el científico de investigación en aprendizaje automático de Apple, Awni Hannun, compartió un video que muestra la versión de siete mil millones de parámetros del LLaMA de Meta ejecutándose en un chip M2 Ultra, que alimenta el Mac Studio y el Mac Pro, los sistemas de computación más avanzados de Apple. Otras aplicaciones notables de MLX incluyen la generación de imágenes con Stable Diffusion, la ejecución de reconocimiento de voz a través de Whisper de OpenAI y la implementación de ajuste fino eficiente en parámetros con LoRA.
A medida que Apple intensifica su enfoque en la inteligencia artificial, informes del verano pasado indicaron que la empresa también está desarrollando su propio servicio de chatbot basado en aplicaciones web, conocido como ‘Apple GPT’.
Licencias y Uso Comercial
MLX está disponible bajo la licencia MIT, que ofrece una amplia libertad de uso, incluidas aplicaciones comerciales. Sin embargo, los usuarios deben cumplir con los requisitos de la licencia incluyendo los avisos de copyright y de permisos en todas las copias del software.
Este compromiso con los principios de código abierto no solo demuestra la inversión de Apple en el avance de la tecnología de inteligencia artificial, sino que también empodera a desarrolladores, investigadores y empresas para innovar en el ámbito de la IA utilizando sus robustas herramientas.