Todo lo que necesitas saber sobre la tecnología de IA en dispositivos de Apple

Home Noticias de IA Todo lo que necesitas saber sobre la tecnología de IA en dispositivos de Apple

Tras Microsoft Build y Google I/O, Apple enfrentó grandes expectativas para presentar sus capacidades de IA en dispositivo en la Conferencia Mundial de Desarrolladores 2024. La compañía integró efectivamente la IA generativa en la experiencia del usuario en todos sus dispositivos, mostrando avances impresionantes en este ámbito.

Una característica destacada de las demostraciones de Apple fue el extenso procesamiento en dispositivo. Utilizando sus procesadores avanzados y una rica base de investigación abierta, Apple ofreció funcionalidades de IA de alta calidad y baja latencia en sus teléfonos y computadoras. Aquí te presentamos lo que aprendimos sobre la IA en dispositivo de Apple:

Visión General del Modelo de Apple

En la presentación del Estado de la Unión de Apple y en una publicación de blog del 10 de junio, se reveló que Apple utiliza un modelo de 3 mil millones de parámetros. Aunque no se divulgó el modelo base específico, la compañía presentó recientemente varios modelos abiertos, incluida la familia de modelos de lenguaje OpenELM, que cuenta con una versión de 3 mil millones de parámetros optimizada para dispositivos con recursos limitados.

OpenELM ha sido modificado para mejorar la calidad del modelo sin aumentar la cantidad de parámetros, lo que sugiere que el modelo base de Apple podría ser una variante especializada de OpenELM-3B. Este modelo fue entrenado con 1.8 billones de tokens de conjuntos de datos abiertos, incluidos datos licenciados y de dominio público recopilados por AppleBot.

Socios de Datos Licenciados

Apple ha establecido alianzas para datos licenciados, incluidas negociaciones por un acuerdo de 25 a 50 millones de dólares con Shutterstock para imágenes, y un posible acuerdo de 50 millones de dólares con importantes organizaciones de noticias y publicaciones.

Técnicas de Entrenamiento y Optimización

El modelo ha sido ajustado para seguir instrucciones de manera efectiva mediante el aprendizaje por refuerzo con retroalimentación humana (RLHF) y un algoritmo de ajuste fino de muestreo de rechazo que involucra un comité de profesores. RLHF utiliza datos anotados por humanos para afinar modelos de lenguaje según las preferencias del usuario, ganando popularidad con el lanzamiento de ChatGPT. El muestreo de rechazo genera múltiples ejemplos de entrenamiento, seleccionando el mejor resultado para las actualizaciones del modelo, una técnica también empleada por el equipo de Llama-2.

Optimizaciones Técnicas

Apple implementó diversas técnicas para mejorar el rendimiento del modelo manteniendo la eficiencia de recursos. El modelo base utiliza "atención por consultas agrupadas" (GQA), desarrollada por Google Research, para acelerar la velocidad de inferencia con un impacto mínimo en memoria y computación. Además, se utiliza "paletización" para comprimir pesos mediante tablas de consulta, junto con cuantización, que reduce el número de bits por parámetro.

Los modelos están optimizados para dispositivos con chips M1 y versiones posteriores, y los iPhone 15 Pro y Pro Max que cuentan con el chip A17 Pro. Esto sugiere la utilización de técnicas de optimización adaptadas a los chips de Apple, como el modelo de lenguaje grande (LLM) en flash introducido el año pasado.

Métricas de Rendimiento

Los resultados reportados en un iPhone 15 Pro muestran una latencia de primer token de aproximadamente 0.6 milisegundos por token de solicitud, con una tasa de generación de 30 tokens por segundo. Por ejemplo, enviar un aviso de 1,000 tokens generaría una respuesta en 0.6 segundos, generando posteriormente tokens a una tasa de 30 por segundo, demostrando así un rendimiento impresionante.

Personalización con Adaptación de Bajo Rango

Para mejorar la funcionalidad sin duplicar el modelo, los ingenieros de Apple desarrollaron versiones ajustadas utilizando adaptadores de adaptación de bajo rango (LoRA). LoRA actualiza un pequeño subconjunto de pesos para tareas específicas, y los adaptadores—cada uno con menos de 100 megabytes—permiten a los dispositivos almacenar múltiples opciones para diversas funciones como corrección, resumir y respuestas a correos electrónicos.

Evaluación del Rendimiento

Según las evaluaciones de Apple, su modelo generalmente supera a modelos de tamaño similar e incluso mayores, incluidos Gemma-2B, Mistral-7B y Phi-3B-Mini.

En resumen, la IA en dispositivo de Apple ilustra el potencial de combinar modelos compactos con técnicas de optimización efectivas, datos de calidad y hardware robusto. La compañía ha logrado avances significativos en equilibrar la precisión con la experiencia del usuario. Será interesante ver cómo se desempeña esta tecnología cuando se implemente para los consumidores este otoño.

El Tour de Impacto de VB AI: ¿Cuál es el Futuro de la Participación Humana en la Auditoría?

Microsoft Descontinúa Copilot GPT Builder Tras Solo 3 Meses: ¿Qué Siguientes Pasos?

Most people like

Second Nature

31.6K

Aprovechando el Juego de Roles Potenciado por IA para Mejorar el Rendimiento en Ventas Desbloquea el potencial de tu equipo de ventas con estrategias innovadoras de juego de roles impulsadas por IA, diseñadas para mejorar el rendimiento. Al simular escenarios del mundo real, estas herramientas interactivas ofrecen retroalimentación invaluable y mejoran las habilidades de comunicación, lo que lleva a un aumento en el éxito de las ventas. Descubre cómo la integración de tecnología de IA en la capacitación puede transformar tu enfoque de ventas y generar resultados medibles.

software de formación en ventas AI Product Description Generator

Handwriting OCR

31.6K

Transforma Contenido Manuscrito en Formatos Digitales con Precisión En el acelerado mundo digital actual, convertir contenido manuscrito a formato digital nunca ha sido tan importante. Ya sea que desees preservar notas, transformar bocetos en gráficos digitales o agilizar la documentación, la digitalización precisa de material manuscrito es esencial para mejorar la eficiencia y la accesibilidad. Aprovecha el poder de la tecnología para hacer que tu contenido manuscrito sea fácilmente buscable, editable y compartible, asegurando que tu valiosa información esté siempre al alcance de tu mano.

OCR de escritura a mano Handwriting

Arize AI

128.8K

Mejora la velocidad de tu modelo y optimiza los resultados de IA para un rendimiento superior.

Observabilidad de IA Large Language Models (LLMs)

Synthace

27.1K

Synthace capacita a los equipos de investigación y desarrollo para realizar experimentos y recopilar datos sin esfuerzo, sin necesidad de codificación. Esta innovadora plataforma optimiza el proceso experimental, haciéndolo accesible para científicos e investigadores de todos los niveles de habilidad.

ciencia de la vida AI Product Description Generator

Find AI tools in YBX