Existem dados grandes e, em seguida, dados realmente grandes—pense em trilhões de linhas de dados. A Ocient, com sede em Chicago, está na vanguarda desse domínio com sua tecnologia de data warehouse hiperescalar de ponta.
Hoje, a Ocient revelou novas capacidades que aprimoram sua plataforma de dados hiperescaláveis, especialmente para análises geoespaciais e aprendizado de máquina (ML) e inteligência artificial (IA). A nova funcionalidade OcientGeo inclui uma biblioteca abrangente de funções geoespaciais e um índice espacial globalmente otimizado. Isso capacita as empresas a ingerir e analisar eficientemente grandes volumes de dados geoespaciais históricos e em tempo real, gerando insights acionáveis. Ferramentas de ML integradas aceleram ainda mais as iniciativas de IA geoespacial.
A Ocient utiliza armazenamento e processamento otimizados, atendendo às demandas de dados hiperescaláveis sem depender de GPUs.
“Nosso foco está em cargas de trabalho hiperescaláveis. Em uma consulta média da Ocient—seja SQL, aprendizado de máquina ou geoespacial—geralmente estamos lidando com cerca de um trilhão de elementos,” afirmou o CEO da Ocient, Chris Gladwin.
Análise de Dados Hiperescala: Fluxo em vez de GPUs
Enquanto muitas organizações otimizam o desempenho com GPUs, a Ocient adota uma estratégia diferente. “A chave para nosso sucesso é um nível extraordinário de paralelização,” explicou Gladwin. “Não é incomum ter mais de um milhão de tarefas paralelas em execução em cada camada do stack.”
Para alcançar essa extensa paralelização em seu data warehouse, a Ocient enfatiza o fluxo. Gladwin observou que, em algoritmos de aprendizado de máquina para agrupamento, regressão e classificação, as limitações geralmente não vêm das operações computacionais da CPU, mas sim da densidade computacional—especificamente, da necessidade de maior poder de processamento por terabyte de dados.
O principal desafio reside em garantir um throughput suficiente por todo o stack de computação, incluindo armazenamento e memória. Isso está no cerne da inovação técnica da Ocient, que se especializa em otimizar sistemas de memória e armazenamento rápido em drives de estado sólido (SSD).
“Nossos engenheiros valorizam as GPUs—são impressionantes—mas simplesmente não encontramos uma necessidade para elas,” comentou Gladwin.
Aprendizado de Máquina em Hiperescala com OcientML
O data warehouse da Ocient inicialmente focava em consultas de dados SQL, e as mesmas vantagens arquitetônicas que permitem análises rápidas em grandes conjuntos de dados agora sustentam o OcientML e o OcientGeo.
Gladwin destacou que o OcientML permite que os clientes executem aprendizado de máquina em conjuntos de dados contendo bilhões a trilhões de pontos de dados, oferecendo métricas de custo-benefício superiores em comparação com alternativas. Funcionalidades como gerenciamento de carga de trabalho garantem acesso equitativo aos recursos em várias consultas e análises hiperescaláveis. Além disso, o OcientML está integrado ao Ocient Hyperscale Data Warehouse, eliminando a necessidade de extrair, transformar e carregar dados em uma plataforma separada.
Os benefícios do OcientML incluem maior precisão de modelos por meio da interação completa com dados históricos e atuais, iterações aceleradas pela eliminação de movimentos desnecessários de dados e operações simplificadas ao gerenciar SQL e ML dentro de um sistema unificado.
O OcientGeo segue uma abordagem semelhante, sendo parte integrante do Ocient Hyperscale Data Warehouse, aproveitando a extensa paralelização da plataforma. Com o OcientGeo, os usuários podem realizar consultas e análises geoespaciais em grandes conjuntos de dados diretamente no ambiente da Ocient, evitando a necessidade de extração de dados em larga escala. Essa capacidade permite que consultas geoespaciais envolvendo trilhões de pontos de dados sejam executadas em segundos.
“Estamos apenas começando a explorar essas novas aplicações que só podem ser viabilizadas ao aumentar em dez vezes ou mais o preço e o desempenho da análise hiperescalar,” concluiu Gladwin.