Snowflake Data Cloud se Expande con Modelos de Lenguaje Grande Multimodal (LLMs)
Snowflake Data Cloud, dirigido por Sridhar Ramaswamy, está avanzando sus capacidades al integrar modelos de lenguaje grande multimodal (LLMs). La compañía se ha asociado con Reka, una startup de IA fundada por exinvestigadores de DeepMind, Google y Meta, para incorporar sus modelos propietarios en la plataforma de datos de Snowflake.
Esta colaboración sigue a la reciente alianza de Snowflake con Mistral y permitirá a las empresas que utilizan la nube de datos desarrollar aplicaciones de IA generativa que procesen texto, imágenes y videos. Esta integración abre la puerta para que los equipos obtengan nuevos conocimientos de sus conjuntos de datos.
Snowflake participó el año pasado en una ronda de financiación de $60 millones de Reka, pero no ha confirmado si aumentará su inversión a través de esta asociación. Baris Gultekin, jefe de gestión de productos en Snowflake AI, afirmó que la compañía busca constantemente apoyar a sus socios y fomentar la innovación del cliente, aunque no se dieron detalles específicos sobre la inversión.
Presentación de Reka Flash y Core en Snowflake Cortex
Desde su lanzamiento, Snowflake ha pretendido consolidarse como la infraestructura de datos preferida por los clientes. Inicialmente ofreció un almacén de datos básico, pero ha evolucionado para soportar diversos formatos y capacidades, resultando en una nube de datos completa que permite múltiples aplicaciones de IA y análisis.
En respuesta al auge de la IA generativa, Snowflake presentó Snowflake Cortex, un servicio completamente gestionado diseñado para desarrollar aplicaciones LLM. Cortex ofrece a las empresas una colección de bloques de construcción de IA, incluidos LLM de código abierto, permitiendo analizar datos de forma segura mientras desarrollan aplicaciones específicas para diversas necesidades empresariales. La empresa empezó enfocándose en LLM especializados para tareas como el análisis de sentimientos y ahora se expande para incluir dos LLM de Reka: Flash y Core.
Reka Flash es un modelo de vanguardia que cuenta con 21 mil millones de parámetros, optimizado para ofrecer un rendimiento comparable a modelos más grandes en métricas de lenguaje y visión. Por otro lado, Core es el modelo más grande de Reka, acercándose al rendimiento de modelos avanzados como GPT-4 y Gemini Ultra, aunque no está disponible públicamente en este momento.
Snowflake planea integrar el modelo Flash en Cortex de inmediato, mientras que el soporte para el modelo Core se está desarrollando para un futuro lanzamiento. Aunque Gultekin no proporcionó un calendario, indicó que estará disponible pronto y mencionó la posibilidad de agregar otros modelos de Reka según la demanda.
Beneficios de la IA Multimodal para los Usuarios de Snowflake
Con la integración de Cortex y los modelos de IA de Reka, los usuarios de Snowflake pueden crear aplicaciones de IA generativa capaces de procesar texto, imágenes y videos. Esta funcionalidad respalda diversas aplicaciones, como la subtitulación de videos, etiquetado de imágenes, generación de descripciones de productos para comercio electrónico y análisis de datos gráficos.
Gultekin destacó varias aplicaciones potenciales, incluidos chatbots que interpretan gráficos y generación de contenido de marketing para empresas de entretenimiento utilizando sus recursos de video e imagen.
Aunque Gultekin no reveló cuántas empresas están aprovechando específicamente los modelos de Reka, compartió que más de 400 empresas están utilizando Cortex y sus modelos alojados para desarrollar aplicaciones de IA generativa. Estas aplicaciones abarcan varios sectores, desde la identificación de vulnerabilidades de seguridad en tickets de servicio hasta la mejora de las comunicaciones de proveedores de salud con datos de aseguradoras.
La adición de los modelos de Reka aumentará el total de LLM disponibles en Cortex a una docena, sumándose a los de Mistral y Google introducidos recientemente.
Gultekin describió la pipeline de innovación de IA de Snowflake como en “sobrecarga”, con el objetivo de hacer la IA accesible para todos los usuarios y generar resultados comerciales significativos rápidamente. Sugirió que se anunciarán próximamente más avances en IA antes de la cumbre anual en junio.
“Nuestra hoja de ruta refleja el principio de que las estrategias efectivas de IA están fundamentadas en estrategias sólidas de datos: los datos son el combustible para la IA. Estamos comprometidos a mejorar la productividad, la colaboración y la eficiencia general en los flujos de trabajo de IA y ML, todo basado en la base de datos segura y confiable de Snowflake”, afirmó Gultekin.
Cabe destacar que Databricks, un competidor en el ecosistema de datos, está implementando un enfoque similar. Tras su adquisición de MosaicML, la compañía ha introducido modelos abiertos y herramientas mejoradas para desarrollar aplicaciones de IA generativa. Recientemente, Databricks adquirió Lilac, una startup de IA especializada en analizar y refinar datos no estructurados para el entrenamiento de IA.