"Una nueva era de IA móvil." Así es como Samsung está promocionando su próxima serie de teléfonos inteligentes Galaxy S24. En el evento Unpacked, la compañía promete "una experiencia móvil completamente nueva impulsada por IA".
Samsung no es el primero en aprovechar el actual entusiasmo por la IA generado por plataformas como ChatGPT y Midjourney. Los grandes actores en procesadores de smartphones, como Qualcomm y MediaTek, han presentado recientemente las impresionantes capacidades de IA generativa en sus últimos chips de gama alta y media.
Está claro que la IA dominará el marketing de smartphones, pero ¿qué podemos esperar realmente? El valor añadido de estos "avances en IA" sigue siendo incierto y puede que simplemente implique reempacar características existentes bajo nuevos nombres o aplicaciones.
A partir de la serie Galaxy S24, estos dispositivos contarán con el chip Snapdragon 8 Gen 3 de Qualcomm. Este fabricante de chips ha hecho afirmaciones sorprendentes sobre sus capacidades de IA generativa, sugiriendo que puede crear imágenes a partir de descripciones de texto en menos de un segundo usando tecnología de Stable Diffusion. Qualcomm ha proporcionado una explicación detallada sobre cómo optimizó Stable Diffusion para su uso en dispositivo. Mientras tanto, MediaTek afirma que su Dimensity 9300 permitirá también la generación casi instantánea de texto a imagen a través de Stable Diffusion. Curiosamente, el iQoo 12, ya equipado con el último chip de Qualcomm, no menciona estas características de IA generativa en su marketing.
Si asumimos que Samsung ofrecerá generación de imágenes a partir de texto, ¿qué logrará en última instancia esta función? No está claro si esta capacidad se integrará en una aplicación de terceros o en una de las propias de Samsung. La pregunta clave es cómo mejorará el uso cotidiano del smartphone. ¿Qué haría un usuario típico del Galaxy S24 con imágenes generadas por IA a partir de un simple texto? Podrían usarlas para animar conversaciones o crear expectación en redes sociales.
Sin embargo, hay complejidades involucradas. Los usuarios necesitarían generar imágenes a partir de texto, luego guardarlas localmente o copiarlas al portapapeles, y finalmente pegarlas en su aplicación de chat preferida. Una solución ideal vería a Samsung integrando esta generación de imágenes directamente en el teclado. No obstante, cabe preguntarse por qué pasar por este proceso cuando emojis, GIFs y stickers pueden lograr un efecto similar. Además, la resolución de salida de 512 x 512 píxeles puede no ser suficiente para tareas como entregas académicas o presentaciones laborales. Puede que también haya costos asociados; la demostración de MediaTek menciona una opción premium. Los usuarios del Galaxy S24 podrían enfrentar límites en los tokens de generación de texto a imagen, lo que llevaría a un rendimiento más lento o tarifas de suscripción una vez que superen las cuotas establecidas.
Si este es el caso, surgen preocupaciones sobre la practicidad, dado que otras soluciones, como DALL-E de OpenAI, ya están disponibles. Los usuarios pueden generar imágenes de forma gratuita o suscribirse a ChatGPT Plus para una velocidad y calidad mejoradas con el último modelo DALL-E 3. Qualcomm afirma que el Snapdragon 8 Gen 3 es el "primer chip en soportar modelos de IA generativa multimodal," lo que significa que el chatbot nativo (basado en el modelo Llama de Meta) aceptará entradas a través de texto, imágenes y voz. Sin embargo, esto no es innovador, ya que capacidades similares ya existen en ChatGPT-4, aunque con requisitos de suscripción.
Otra característica intrigante que Qualcomm destaca es la expansión de imágenes por IA, que permite a los usuarios ampliar el lienzo de una imagen en cualquier dirección. La IA generativa del dispositivo produciría píxeles de manera inteligente basándose en las indicaciones del usuario, añadiendo nuevos elementos a la escena. Si bien esto podría mostrar capacidades impresionantes, alterar fotos personales con recuerdos preciados arriesga distorsionar esos recuerdos con visuales irreales.
La resumisión es otro área clave para la IA generativa en el dispositivo. Esto podría mejorar cómo los usuarios se informan sobre eventos actuales. Sin embargo, su efectividad depende de la facilidad de uso; por ejemplo, permitir a los usuarios resumir artículos de noticias sin necesidad de cambiar a otra aplicación mejoraría significativamente la experiencia.
Otras características propuestas, como la edición de fotos por voz, suenan convenientes, pero es difícil evaluar su verdadero valor cuando opciones actuales, como filtros de un solo toque, ya ofrecen experiencias de edición rápidas y satisfactorias. Al moverse hacia funcionalidades básicas como generar respuestas genéricas en chats o obtener respuestas que normalmente requieren búsquedas en internet, surgen nuevos desafíos.
Los modelos de IA generativa que funcionan de manera nativa en smartphones, como el Llama de Meta, no son los más avanzados, principalmente por recursos limitados. Tomemos a Google, por ejemplo; el Pixel 8 Pro utiliza una versión básica de sus grandes modelos de lenguaje llamada Gemini Nano. ¿Por qué no optar por un modelo más capaz, como ChatGPT o Pi, a través de aplicaciones móviles dedicadas?
Actualmente, la aplicación más práctica de la IA generativa podría estar en reducir la dependencia de servicios en la nube, permitiendo tareas offline mientras se mejora la privacidad de datos. Idealmente, estas herramientas en el dispositivo deberían integrarse de manera fluida con asistentes virtuales existentes como Google Assistant, Alexa o Siri. Imagínate instruyendo a tu asistente de IA para compilar todas las imágenes de gatos de tu galería en un collage para tu papá, o planificando un viaje a Disneyland, completo con los mejores precios de boletos y un itinerario ordenado en Google Calendar.
Si la IA generativa en el dispositivo mantiene los datos del usuario locales, podría fomentar un ambiente de privacidad de datos, al menos en teoría. Por ahora, la promesa de las capacidades de IA de Samsung sigue siendo incierta. Será intrigante ver si Samsung puede ofrecer experiencias significativas de IA generativa o simplemente proporcionar una colección de funciones llamativas, aunque poco prácticas.