Meta Platforms, la empresa matriz de Facebook, Instagram, WhatsApp y Oculus VR, está causando revuelo esta semana con la introducción de una nueva IA multimodal para sus gafas inteligentes Ray-Ban Meta. Tras el lanzamiento de su IA de clonación de voz, Audiobox, Meta ha comenzado una fase de prueba beta en EE. UU. para evaluar esta innovadora tecnología.
Según Andrew Bosworth, Director de Tecnología de Meta, la IA multimodal se lanzará al público en 2024. En un video de Instagram, compartió: "El próximo año lanzaremos un asistente de IA que utiliza la cámara de las gafas para proporcionar información no solo basada en consultas de los usuarios, sino también sobre el entorno que les rodea." Este programa de prueba beta ya está en marcha, aunque no se han revelado detalles sobre cómo participar.
Las gafas inteligentes Ray-Ban Meta, con un precio de $299, fueron presentadas en la conferencia anual Connect de Meta en septiembre. Los modelos más recientes incluyen un asistente básico de IA que responde a comandos de voz, similar a Alexa de Amazon o Siri de Apple, pero carece de la capacidad para analizar de manera inteligente videos o fotos en tiempo real.
En su publicación, Bosworth ilustró el potencial de la IA al usar las gafas mientras observaba una pieza de arte mural iluminada. Consultó a la IA, que identificó con precisión la obra como una “escultura de madera” y la describió como “hermosa”. Esto sugiere que la IA también podría depender de un teléfono inteligente conectado para mejorar su rendimiento e interacción.
El CEO de Meta, Mark Zuckerberg, también demostró las capacidades de la IA, mostrándola recomendar prendas de vestir que combinan, generar subtítulos ingeniosos, reconocer una fruta que sostenía y traducir texto del español al inglés.
Este movimiento subraya el compromiso de Meta por integrar la IA en sus productos y fomentar la IA de código abierto a través de su modelo Llama 2. En un contexto donde la IA generativa ha ido evolucionando hacia el hardware, la iniciativa de Meta destaca, especialmente en comparación con intentos previos como Google Glass, que enfrentaron desafíos de usabilidad y percepción pública.
¿Superará la IA multimodal de Meta para las gafas smart Ray-Ban las dificultades que experimentaron otros modelos anteriores? A medida que la tecnología avanza y las actitudes sociales cambian, solo el tiempo dirá si esta innovación encontrará su lugar en el mercado.