Apple Lanza Modelo de IA de Código Abierto para Ejecución en Dispositivos

Apple ha lanzado hoy una serie de modelos de lenguaje de código abierto (LLMs) diseñados para operar en dispositivos en lugar de depender de servidores en la nube. Denominados OpenELM (Modelos de Lenguaje Abierto y Eficiente), estos modelos ya están disponibles en el Hugging Face Hub, creando una plataforma comunitaria para compartir código de IA.

OpenELM incluye ocho modelos: cuatro preentrenados utilizando la biblioteca CoreNet y cuatro ajustados mediante modificaciones guiadas. Apple ha implementado una estrategia de escalado jerárquico que asigna parámetros de manera eficiente a cada capa del modelo Transformer, mejorando tanto la precisión como la eficiencia. Por ejemplo, con un presupuesto de aproximadamente mil millones de parámetros, OpenELM logra una mejora del 2.36% en la precisión en comparación con OLMo, al mismo tiempo que reduce significativamente la demanda de tokens de preentrenamiento a la mitad.

A diferencia de lanzamientos anteriores que solo proporcionaban pesos de modelo y código de inferencia, este lanzamiento presenta un marco completo para el entrenamiento y evaluación de modelos de lenguaje en conjuntos de datos públicos. Esto incluye registros de entrenamiento, múltiples puntos de control y configuraciones de preentrenamiento. Apple busca que esta iniciativa acelere los avances en el campo de la IA de lenguaje natural y ofrezca “resultados más confiables”.

La liberación de estos modelos abiertos tiene como objetivo “empoderar y enriquecer la comunidad de investigación abierta”, permitiendo a los investigadores explorar a fondo los riesgos, el uso de datos y los sesgos de los modelos. También se anima a desarrolladores y empresas a utilizar o modificar directamente estos modelos para satisfacer sus necesidades específicas.

Al compartir abiertamente esta información, Apple se compromete a atraer a ingenieros, científicos y expertos líderes para impulsar la investigación en campos relevantes, a pesar de los desafíos de publicar bajo las políticas de confidencialidad de Apple. Aunque las características de IA aún no se han integrado en los dispositivos de Apple, se espera que iOS 18 introduzca una serie de nuevas capacidades de IA, con indicios de que Apple planea trasladar sus modelos de lenguaje grandes a operaciones en dispositivos para mejorar la privacidad.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles