O summit anual da Databricks continua a ser um encontro vibrante para os envolvidos no ecossistema de dados. A cada ano, a empresa apresenta tecnologias inovadoras, parcerias e avanços destinados a simplificar a gestão de dados estruturados e não estruturados. O summit deste ano manteve essa tradição, com um foco notável em inteligência artificial (IA).
Durante o discurso de abertura, o CEO Ali Ghodsi apresentou uma gama de inovações na interseção de dados e IA, reforçando o compromisso da empresa em otimizar conjuntos de dados governados na plataforma Databricks Data Intelligence. Os principais destaques incluíram melhorias no Mosaic AI, um modelo de geração de imagens, e uma solução de IA generativa projetada para análises de dados mais eficientes.
Aqui estão os principais anúncios do summit deste ano:
1. Unity Catalog em Código Aberto
Em um movimento estratégico para competir com o Polaris Catalog da Snowflake, a Databricks lançou o Unity Catalog como código aberto sob licença Apache 2.0, acompanhado de especificações OpenAPI. Isso permite que outras empresas utilizem a arquitetura e o código para criar catálogos que suportem vários formatos de dados, incluindo Iceberg e Delta/Hudi. O código foi compartilhado ao vivo durante a palestra, com a expectativa de que a Snowflake siga o exemplo nos próximos 90 dias.
2. Atualizações do Mosaic AI para Sistemas em Produção
O Mosaic AI, a ferramenta para desenvolvimento de aplicações de IA, recebeu melhorias significativas visando ajudar as equipes a criar sistemas de IA compostos confiáveis e prontos para produção. Novos recursos incluem o produto Mosaic AI Model Training, um framework de Agente IA, um framework de Avaliação e o Catálogo de Ferramentas de IA e Gateway de IA para governança. Todas as ofertas, exceto as ferramentas de IA, estão agora disponíveis em pré-visualização pública.
3. Novo Modelo de Texto-para-Imagens para Empresas
A Databricks apresentou a pré-visualização privada do Shutterstock ImageAI, um modelo de IA generativa que permite às empresas criar imagens de alta fidelidade para diversas aplicações empresariais. Este modelo, pré-treinado com Mosaic AI e a coleção de imagens confiáveis da Shutterstock, pode ser acessado através do gerador de imagens da Shutterstock e pode ser ajustado por meio do Mosaic AI ou integrado via APIs.
4. Databricks AI/BI para Análises Inteligentes
Para ajudar as empresas a democratizar o acesso a insights analíticos, a Databricks lançou o Databricks AI/BI, um sistema de IA composto integrado à plataforma Data Intelligence. Utilizando agentes IA — Dashboards e Genie — este sistema interpreta consultas empresariais para produzir respostas e visualizações em linguagem natural. Cada agente se concentra em funções específicas, como planejamento, geração de SQL e visualização, suportadas por componentes adicionais como classificação de respostas e indexação vetorial. Esta oferta está disponível para todos os clientes do Databricks SQL Pro e Serverless, com Dashboards agora disponíveis geralmente e Genie em pré-visualização pública.
5. Databricks LakeFlow para Engenharia de Dados Simplificada
A Databricks também revelou o LakeFlow, uma experiência unificada projetada para simplificar todos os aspectos da engenharia de dados, desde a ingestão até a transformação e orquestração. O LakeFlow simplifica o processo tradicionalmente complexo de construção e manutenção de pipelines de dados, automatizando sua implantação, operação e monitoramento, com suporte robusto para CI/CD e verificações de qualidade em grande escala. Embora ainda não esteja em pré-visualização, a Databricks abriu uma lista de espera para acesso antecipado.
6. Parcerias com Nvidia e Gretel
Por fim, a Databricks anunciou parcerias significativas com Nvidia e Gretel. A colaboração com a Nvidia visa incorporar suporte nativo para computação acelerada por CUDA no motor de consulta vetorizado de próxima geração da Databricks, o Photon, aprimorando o desempenho de cargas de trabalho de data warehousing e análises. A parceria com a Gretel designa a empresa como parceira tecnológica ISV, oferecendo conjuntos de dados sintéticos de alta qualidade para o desenvolvimento e personalização de modelos de aprendizagem de máquina na plataforma da Databricks.