Yoav Shoham, Co-CEO de AI21, una destacada empresa de modelos de lenguaje de gran tamaño (LLM), respondió a recientes comentarios de Amazon y otros sobre la supuesta pérdida de singularidad de los LLM. Shoham desmintió firmemente esta idea, afirmando: “Los modelos sí se diferencian”.
AI21 se especializa en desarrollar LLM específicos para tareas, destacándose especialmente en la resumación de textos para aplicaciones empresariales. En mi entrevista con Shoham, exploramos los últimos avances en inteligencia artificial generativa, incluidos los desafíos de OpenAI y los recientes anuncios de Amazon AWS.
Los comentarios de Shoham surgieron en respuesta a una observación sobre la percepción de que los LLM pueden estar perdiendo su distintividad, con opiniones que sugieren que el verdadero valor de la IA generativa podría residir en los datos propietarios. Swami Sivasubramanian, VP de Datos y IA en Amazon AWS, señaló: “Si todos los proveedores construyen modelos que se parecen mucho, ¿dónde está la diferenciación?” Subrayó la importancia de que las empresas aprovechen efectivamente sus datos exclusivos para crear aplicaciones de IA únicas.
Este sentimiento fue compartido por Miguel Paredes, VP de IA y Ciencia de Datos en Albertsons, quien expresó este mes: “Estos modelos se están convirtiendo en commodities.” Destacó que el acceso a modelos como ChatGPT de OpenAI y Google Bard es casi uniforme para todas las empresas, instándolas a centrarse en sus propios datos para obtener ventaja competitiva.
Shoham reconoció el papel crucial de los datos, pero argumentó que la creación de sistemas de IA excepcionales sigue estando centrada en los LLM, al menos por ahora. “Crear un modelo de lenguaje excelente es un desafío, y puede llevar tiempo evaluar sus capacidades y limitaciones,” explicó. Señaló que las métricas convencionales e incluso el prototipado directo ofrecen solo una visión débil del verdadero rendimiento de un modelo.
Destacó que incluso las tareas aparentemente simples, como la resumación de textos, pueden ser complicadas para los LLM. Al enfocarse en tareas específicas, estos modelos pueden mejorar significativamente. Por ejemplo, el modelo de resumación de textos de AI21 superó a GPT-4, ChatGPT y Claude en evaluaciones realizadas por una importante institución financiera.
De cara al futuro, Shoham reconoce que el enfoque evolucionará en el próximo año. “Hablaremos de sistemas de IA que incorporen grandes modelos de lenguaje, junto con muchas otras capacidades. Es un océano azul: hay amplio espacio para la innovación.”