A Databricks, uma empresa de software empresarial em rápido crescimento, lançou o DBRX, um inovador modelo de inteligência artificial de código aberto que visa redefinir padrões de eficiência e desempenho em IA. Com 132 bilhões de parâmetros, o DBRX supera modelos de código aberto líderes como Llama 2-70B e Mixtral em áreas críticas, incluindo compreensão de linguagem, capacidade de programação e proficiência matemática.
Embora não alcance as capacidades do GPT-4 da OpenAI, executivos da Databricks ressaltam que o DBRX é uma alternativa mais eficiente e econômica ao GPT-3.5. “Estamos entusiasmados em apresentar o DBRX ao mundo e avançar na IA de código aberto,” afirmou Ali Ghodsi, CEO da Databricks, durante um evento recente. “Enquanto modelos como o GPT-4 são excelentes ferramentas de uso geral, nosso foco é criar modelos personalizados que entendam profundamente os dados exclusivos de nossos clientes. O DBRX exemplifica nosso compromisso com essa missão.”
O DBRX demonstra desempenho superior em testes de referência para compreensão de linguagem (MMLU), programação (Human Eval) e matemática (GSM 8K). Embora não tenha superado o GPT-4, representa uma melhora significativa em relação ao comumente utilizado GPT-3.5.
Uma característica importante do DBRX é sua inovadora arquitetura de "mistura de especialistas". Ao contrário dos concorrentes que utilizam todos os parâmetros para cada geração de palavras, o DBRX emprega 16 submodelos especialistas, ativando apenas quatro especialistas relevantes para cada token. Esse design otimiza o desempenho utilizando apenas 36 bilhões de parâmetros a qualquer momento, resultando em operações mais rápidas e econômicas.
A equipe Mosaic, um grupo de pesquisa adquirido pela Databricks no ano passado, foi pioneira nessa abordagem, baseada em suas iniciativas anteriores de Mega-MoE. “A equipe Mosaic aprimorou sua capacidade de treinar modelos de IA fundamentais de forma eficiente,” disse Ghodsi. “Podemos produzir modelos de IA de alta qualidade rapidamente — o DBRX levou cerca de dois meses para ser desenvolvido e custou aproximadamente 10 milhões de dólares.”
Ao open-sourçar o DBRX, a Databricks visa se posicionar como líder em pesquisa avançada em IA, promovendo uma adoção mais ampla de sua arquitetura inovadora. Este lançamento também está alinhado com o foco principal da Databricks em construir e hospedar modelos de IA personalizados adaptados a conjuntos de dados específicos dos clientes.
Atualmente, muitos clientes da Databricks ainda dependem de modelos como o GPT-3.5 da OpenAI. No entanto, o uso de modelos de terceiros para dados corporativos sensíveis levanta preocupações de segurança. “Nossos clientes confiam em nós com dados regulados em jurisdições globais,” notou Ghodsi. “Como seus dados já estão com a Databricks, o DBRX oferece capacidades avançadas de IA, garantindo a segurança dos dados.”
Embora o DBRX não concorra diretamente com o GPT-4, ele supera significativamente o GPT-3.5 em benchmarks de compreensão de linguagem, programação e matemática, posicionando-se como uma alternativa capaz de código aberto a um custo menor.
O lançamento do DBRX acontece em meio à crescente concorrência no setor de plataformas de dados e IA, com rivais como a Snowflake introduzindo funcionalidades semelhantes e grandes provedores de nuvem aprimorando suas ofertas de IA generativa. Ao afirmar sua presença na pesquisa open-source de alto nível, a Databricks busca se estabelecer como líder em IA e atrair os melhores talentos em ciência de dados. Além disso, o lançamento capitaliza sobre o crescente ceticismo em relação aos modelos de IA comerciais oferecidos por grandes empresas de tecnologia, que são percebidos como opacos.
O verdadeiro teste para o DBRX será sua adoção e o valor que ele entrega aos clientes da Databricks. À medida que as empresas buscam cada vez mais aproveitar a IA enquanto mantêm o controle sobre seus dados proprietários, a Databricks acredita que sua combinação única de pesquisas de ponta e plataformas empresariais robustas a distinguirá dos concorrentes. Com a introdução do DBRX, a Databricks desafia tanto grandes empresas de tecnologia quanto concorrentes de código aberto a igualar seus avanços inovadores. À medida que o cenário da IA se torna mais competitivo, a Databricks está pronta para se tornar um player significativo.