Snowflake Data Cloud se Expande com Modelos de Linguagem Grande Multimodal (LLMs)
O Snowflake Data Cloud, sob a liderança de Sridhar Ramaswamy, está ampliando suas capacidades ao integrar modelos de linguagem grande multimodal (LLMs). A empresa firmou parceria com a Reka, uma startup de IA fundada por ex-pesquisadores da DeepMind, Google e Meta, para incorporar seus modelos proprietários na plataforma de dados da Snowflake.
Essa colaboração segue a recente parceria da Snowflake com a Mistral e permitirá que as empresas que utilizam a nuvem de dados desenvolvam aplicações de IA generativa que podem processar texto, imagens e vídeos, abrindo novas possibilidades de insights a partir de seus conjuntos de dados.
O Snowflake participou da rodada de financiamento de $60 milhões da Reka no ano passado, mas não confirmou se aumentará seu investimento através dessa parceria. Baris Gultekin, chefe de gerenciamento de produtos da Snowflake AI, destacou que a empresa está constantemente buscando apoiar parceiros e estimular a inovação dos clientes, embora não tenha revelado detalhes específicos sobre investimentos.
Introduzindo Reka Flash e Core no Snowflake Cortex
Desde seu lançamento, a Snowflake busca se estabelecer como a infraestrutura de dados preferida pelos clientes. Inicialmente oferecendo um armazém de dados básico, a Snowflake evoluiu para suportar diversos formatos e capacidades de dados, resultando em uma nuvem de dados abrangente que abriga várias aplicações de IA e análise.
Em resposta ao crescente cenário de IA generativa, a Snowflake lançou o Snowflake Cortex, um serviço totalmente gerenciado projetado para desenvolver aplicações de LLM. O Cortex oferece às empresas uma coleção de blocos de construção de IA, incluindo LLMs de código aberto, permitindo analisar dados com segurança enquanto desenvolvem aplicações específicas para necessidades empresariais distintas. A empresa inicialmente focou em LLMs especializados para tarefas como análise de sentimento e agora está expandindo para incluir dois LLMs da Reka: Flash e Core.
O Reka Flash é um modelo de ponta com 21 bilhões de parâmetros, otimizado para oferecer desempenho comparável a modelos maiores em benchmarks de linguagem e visão. Em contrapartida, o Core é o maior modelo da Reka, próximo ao desempenho de modelos avançados como GPT-4 e Gemini Ultra, mas não está disponível publicamente no momento.
A Snowflake planeja integrar o modelo Flash no Cortex imediatamente, enquanto o suporte para o modelo Core está em desenvolvimento para um lançamento futuro. Embora Gultekin não tenha fornecido um cronograma, ele indicou que estará disponível em breve e mencionou a possibilidade de adicionar outros modelos da Reka conforme a demanda.
Benefícios da IA Multimodal para Usuários da Snowflake
Com a integração do Cortex e dos modelos de IA da Reka, os usuários da Snowflake podem criar aplicações de IA generativa capazes de processar texto, imagens e vídeos. Essa funcionalidade suporta diversas aplicações, como legendas de vídeo, marcação de imagens, geração de descrições de produtos para o e-commerce e análise de dados gráficos.
Gultekin destacou várias aplicações potenciais, incluindo chatbots que interpretam gráficos e geração de conteúdo de marketing para empresas de entretenimento usando seus ativos de vídeo e imagem.
Embora Gultekin não tenha revelado o número específico de empresas que utilizam os modelos da Reka, ele compartilhou que mais de 400 empresas estão utilizando o Cortex e seus modelos hospedados para desenvolver aplicações de IA generativa. Essas aplicações abrangem vários setores, desde a identificação de vulnerabilidades de segurança em tickets de serviço até a melhoria da comunicação entre prestadores de serviços de saúde e dados de seguradoras.
A adição dos modelos da Reka expandirá o número total de LLMs disponíveis no Cortex para uma dúzia, unindo-se àqueles da Mistral e Google, recém-introduzidos.
Gultekin descreveu o pipeline de inovação em IA da Snowflake como estando em "overdrive", com o objetivo de tornar a IA acessível a todos os usuários para impulsionar rapidamente resultados comerciais significativos. Ele insinou que novos anúncios sobre avanços em IA serão feitos antes do cúpula anual em junho.
“Nossa roadmap reflete o princípio de que estratégias eficazes de IA são fundamentadas em estratégias robustas de dados—os dados são o combustível da IA. Estamos comprometidos em aumentar a produtividade, colaboração e eficiência geral nas soluções de IA e ML, tudo construído sobre a base de dados segura e confiável da Snowflake”, afirmou Gultekin.
Notavelmente, a Databricks, um concorrente no ecossistema de dados, está implementando uma abordagem semelhante. Após adquirir a MosaicML, a empresa introduziu modelos abertos e melhorou ferramentas para o desenvolvimento de aplicações de IA generativa. Recentemente, a Databricks adquiriu a Lilac, uma startup de IA especializada na análise e refinamento de dados não estruturados para treinamento em IA.