Databricks, una empresa de software en rápido crecimiento, ha lanzado DBRX, un modelo de inteligencia artificial de código abierto que redefine los estándares de eficiencia y rendimiento en IA. Con 132 mil millones de parámetros, DBRX supera a modelos de código abierto líderes como Llama 2-70B y Mixtral en áreas críticas como comprensión del lenguaje, habilidad de programación y destrezas matemáticas.
Aunque no alcanza las capacidades de GPT-4 de OpenAI, ejecutivos de Databricks destacan que DBRX es una alternativa más eficiente y económica que GPT-3.5. "Estamos emocionados de presentar DBRX al mundo y avanzar en la IA de código abierto", afirmó Ali Ghodsi, CEO de Databricks, en un evento reciente. "Mientras que modelos como GPT-4 son herramientas excelentes de propósito general, nuestro enfoque está en crear modelos personalizados que comprendan profundamente los datos propietarios de nuestros clientes. DBRX ejemplifica nuestro compromiso con esta misión".
DBRX muestra un rendimiento superior en pruebas de referencia para comprensión del lenguaje (MMLU), programación (Human Eval) y matemáticas (GSM 8K). Aunque no ha superado a GPT-4, representa una mejora significativa respecto al muy utilizado GPT-3.5.
Una característica notable de DBRX es su innovadora arquitectura de "mezcla de expertos". En lugar de usar todos los parámetros para generar cada palabra como hacen sus competidores, DBRX utiliza 16 submodelos expertos, activando solo cuatro expertos relevantes para cada token. Este diseño optimiza el rendimiento al utilizar solo 36 mil millones de parámetros en todo momento, resultando en operaciones más rápidas y económicas.
El equipo Mosaic, un grupo de investigación adquirido por Databricks el año pasado, fue pionero en este enfoque basado en iniciativas previas de Mega-MoE. "El equipo Mosaic ha perfeccionado su capacidad para entrenar modelos de IA fundamentales de manera eficiente", afirmó Ghodsi. "Podemos producir modelos de IA de alta calidad rápidamente: DBRX tomó alrededor de dos meses y costó aproximadamente 10 millones de dólares".
Al abrir el código de DBRX, Databricks busca posicionarse como líder en investigación avanzada de IA promoviendo una adopción más amplia de su arquitectura innovadora. Este lanzamiento está alineado con el enfoque principal de Databricks en construir y hospedar modelos de IA personalizados adaptados a conjuntos de datos específicos de los clientes.
Hoy, muchos clientes de Databricks aún dependen de modelos como GPT-3.5 de OpenAI. Sin embargo, el uso de modelos de terceros para datos corporativos sensibles plantea preocupaciones de seguridad. "Nuestros clientes confían en nosotros con datos regulados en jurisdicciones globales", destacó Ghodsi. "Dado que sus datos ya están con Databricks, DBRX les ofrece capacidades avanzadas de IA manteniendo la seguridad de los datos".
Aunque DBRX no compite directamente con GPT-4, supera significativamente a GPT-3.5 en pruebas de referencia para comprensión del lenguaje, programación y matemáticas, posicionándose como una alternativa de código abierto capaz y a menor costo.
El lanzamiento de DBRX se produce en medio de una creciente competencia en el sector de plataformas de datos e IA, con rivales como Snowflake introduciendo funcionalidades similares y grandes proveedores de la nube mejorando su oferta de IA generativa.
Al consolidar su presencia en la investigación abierta de alto nivel, Databricks busca establecerse como un líder en IA y atraer a los mejores talentos en ciencia de datos. Además, este lanzamiento capitaliza el creciente escepticismo hacia los modelos de IA comerciales ofrecidos por grandes empresas tecnológicas, que son percibidos como opacos.
La verdadera prueba para DBRX será su adopción y el valor que aporte a los clientes de Databricks. A medida que las empresas buscan aprovechar la IA mientras mantienen el control sobre sus datos propietarios, Databricks confía en que su combinación única de investigación de vanguardia y plataformas empresariales robustas lo distinga de sus competidores.
Con la introducción de DBRX, Databricks desafía tanto a las grandes empresas tecnológicas como a sus competidores de código abierto a igualar sus avances innovadores. A medida que el panorama de IA se vuelve más competitivo, Databricks está preparado para ser un jugador importante.