Apple lanza OpenELM: un modelo de lenguaje de código abierto para mejorar el desarrollo de IA en dispositivos.

En un avance significativo en el ámbito de la inteligencia artificial, Apple ha lanzado recientemente OpenELM, una serie de modelos de lenguaje grande (LLMs) de código abierto diseñados para funcionar directamente en dispositivos sin depender de servidores en la nube. Esta innovación no solo refuerza el liderazgo de Apple en IA, sino que también introduce cambios revolucionarios en la investigación y las aplicaciones de procesamiento de lenguaje natural.

La disponibilidad de OpenELM amplía los recursos de IA en la plataforma Hugging Face, creando un espacio colaborativo e innovador para investigadores y desarrolladores de todo el mundo. La serie incluye ocho versiones de modelos: cuatro preentrenados con la biblioteca CoreNet y cuatro ajustados para escenarios de aplicación específicos.

Apple implementó una estrategia de escalado por capas en el desarrollo de OpenELM, distribuyendo de manera efectiva los parámetros a lo largo de cada capa del modelo transformador, lo que resultó en un aumento notable en la precisión. Con un presupuesto de aproximadamente mil millones de parámetros, OpenELM mejora la precisión del modelo OLMo en un 2.36% y reduce a la mitad la cantidad de datos necesarios para el preentrenamiento.

Es importante destacar que, junto con el lanzamiento de OpenELM, Apple ha puesto a disposición el código fuente del modelo, los pesos preentrenados, registros de entrenamiento completos, múltiples puntos de control y configuraciones de preentrenamiento. Este enfoque abierto facilita la reproducción y optimización del modelo por parte de investigadores y desarrolladores, acelerando los avances en el campo del procesamiento de lenguaje natural.

Apple ha declarado que el objetivo de lanzar OpenELM es "empoderar y enriquecer a la comunidad de investigación abierta" con modelos de lenguaje de vanguardia, ofreciendo a los investigadores métodos para explorar riesgos, datos y sesgos del modelo. Los desarrolladores y empresas pueden utilizar o modificar los modelos directamente para satisfacer diversas aplicaciones prácticas.

Además, la iniciativa de código abierto posiciona a Apple para atraer a los mejores ingenieros, científicos y expertos. Su política de transparencia en el intercambio de información brinda a los investigadores la oportunidad de publicar artículos, un privilegio que a menudo estaba restringido por las prácticas secretas anteriores de Apple.

Aunque Apple aún no ha integrado completamente sus capacidades de IA en los dispositivos, hay expectativas generalizadas de que iOS 18 presentará múltiples nuevas funciones de IA. Se rumorea que Apple planea ejecutar sus modelos de lenguaje grande directamente en los dispositivos para mejorar la privacidad del usuario, ofreciendo en última instancia una experiencia más fluida y segura.

El lanzamiento de OpenELM sin duda establece una base sólida para el desarrollo de Apple en inteligencia artificial. A medida que más empresas e instituciones de investigación se involucran en este proyecto de código abierto, se espera que el campo del procesamiento de lenguaje natural experimente más innovaciones y avances. Al adoptar iniciativas de código abierto, Apple demuestra su compromiso con el avance de la tecnología y la promoción de la innovación colaborativa.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles