A medida que se acerca Google I/O 2024, la anticipación crece en torno a los anuncios de inteligencia artificial de Google. El evento comenzó con una enérgica actuación del famoso youtuber Marc Rebillet, quien hizo su entrada de manera singular desde una taza gigante en bata de baño.
Con un tono optimista, Rebillet invitó a los miembros del público a compartir ideas musicales creativas, que cobraron vida gracias al software de DJ de IA de Google. Este comienzo animado presagió el enfoque del evento en la inteligencia artificial, con el CEO Sundar Pichai indicando que el término "IA" se mencionó 121 veces a lo largo de la celebración.
Al finalizar el evento, surgieron dos preguntas clave: ¿Está Google abordando temas que no impactan realmente en la vida cotidiana con sus nuevas ofertas? ¿Existe un mercado viable para hardware especializado de IA valorado en cientos de dólares, cuando los teléfonos inteligentes cuentan ahora con increíbles capacidades de IA?
Evaluación de Dispositivos de IA
El mercado actual presenta dispositivos de IA intrigantes, desde el Rabbit R1 hasta el Humane AI Pin, incluyendo pendants impulsados por IA. Sus funcionalidades son variadas: algunos escuchan, otros conversan, hacen llamadas, graban videos y se conectan a bots de IA para interpretar el entorno. Aunque estos dispositivos son innovadores, la experiencia del usuario ha sido decepcionante. El editor de la sección móvil, Joe Maring, califica al Rabbit R1 como uno de los peores gadgets que ha encontrado, y el Humane AI Pin no ha tenido mucho mejor desempeño. A pesar de ser dispositivos de primera generación, su futuro es incierto ante los recientes desarrollos de gigantes de IA como OpenAI y Google.
La Evolución de la Conciencia sobre IA
Las capacidades de la IA están avanzando significativamente, especialmente en la tecnología de visión, que permite a la IA interpretar el mundo a través de una lente de cámara. En Google I/O 2024, Google presentó Gemini Live, siguiendo el lanzamiento de GPT-4o por OpenAI, un modelo omnimodal que mejora la capacidad de la IA para procesar texto, audio y visuales. Ambos productos buscan ofrecer una interacción fluida: apunta una cámara a casi cualquier cosa y la IA brinda información contextual. Puede identificar la adecuación de la ropa, traducir objetos e incluso localizar elementos extraviados como las llaves del coche.
Aunque las experiencias de ChatGPT y Gemini Live son distintas, ambos comparten capacidades fundamentales. Este es un momento crucial donde la diferencia entre la IA en smartphones y el hardware dedicado es clara.
El Desafío del Hardware
El Rabbit R1 y el Humane AI Pin están equipados con cámaras de 8MP y 12MP, respectivamente, lo que permite cierto procesamiento de imágenes. Sin embargo, no pueden competir con las cámaras avanzadas y estabilizadas presentes en los smartphones modernos. Un smartphone estándar mejora la comprensión de la IA al proporcionar inputs visuales de alta calidad, resultando en una salida mucho más clara—similar a comparar la calidad de video entre smartphones económicos y de gama alta.
Además, estos dispositivos de IA utilizan chips MediaTek y Qualcomm de gama media y carecen del poder computacional que ofrecen los smartphones contemporáneos, que pueden realizar tareas de IA de manera dramáticamente más rápida. Los usuarios no quieren esperar 15 segundos por una respuesta cuando incluso un asistente de voz básico puede gestionar solicitudes mucho más rápido.
La IA generativa funciona de dos maneras principales: mediante procesamiento en la nube, que requiere una conexión a Internet, o a través de procesamiento offline, como Gemini Nano de Google en Pixel 8 y algunos dispositivos Samsung. Este último permite que la IA funcione sin acceso a Internet, pero actualmente, ningún dispositivo de IA independiente opera sin él.
Las Ventajas de la IA en el Dispositivo
Con capacidades de IA en el dispositivo, los usuarios pueden aprovechar funciones como la transcripción de audio en teléfonos Pixel sin necesidad de conexión a Internet. Tecnologías como la Traducción Automática Neural de Google permiten traducciones en tiempo real, y a finales de este año, Gemini Nano con Multimodalidad permitirá el procesamiento local para respuestas contextuales basadas en la entrada de la cámara y el micrófono.
Este enfoque no solo es más rápido, sino que mejora la seguridad de los datos, ya que la información personal permanece en el dispositivo en lugar de ser transmitida en línea. Además, potencialmente reduce los costos asociados con la entrega de funciones de IA generativa, abordando las preocupaciones de los consumidores sobre la asequibilidad en medio del auge de la IA.
La Integración de Gemini con los Servicios de Google
La importancia de la integración se hace evidente en la suite de servicios de Google, incluyendo Gmail, Docs, Drive, Maps, Photos y Search. Gemini ofrece asistentes de IA personalizados diseñados para tareas específicas que se alinean con estos servicios. Los usuarios pueden interactuar con Gemini para planificar viajes, accediendo a correos relevantes e integrando esos datos con Google Search para itinerarios de viaje completos. Para quienes opten por Gemini Advanced, esperan aún más capacidades, como el procesamiento de PDFs extensos, código y multimedia—resumiendo y ofreciendo información esencial.
Gemini mejora las tareas directamente dentro de las aplicaciones, permitiendo que permanezca como una herramienta discreta mientras asiste a los usuarios de manera efectiva en tiempo real.
La Preferencia por Smartphones sobre Dispositivos de IA Dedicados
Un asistente de IA debe proporcionar soporte práctico, equilibrando funcionalidad y conveniencia. Debe aprovechar datos relevantes para mejorar tareas personales y profesionales sin incurrir en costos adicionales. Los actuales gadgets de IA como el Rabbit R1 y el Humane AI Pin tienen dificultades para cumplir con esta promesa debido a sus limitaciones. Dadas las avanzadas capacidades de los smartphones—y su habilidad para ejecutar sofisticadas IA sin los inconvenientes del hardware especializado—invertir en dispositivos de calidad inferior parece imprudente cuando los usuarios pueden confiar en sus teléfonos para un rendimiento superior.
En el cambiante panorama de la IA, los smartphones lideran el camino, volviendo obsoletos a los dispositivos de IA independientes.