Es gibt große Daten und dann gibt es wirklich große Daten — denken Sie an Billionen von Datenreihen. Das in Chicago ansässige Unternehmen Ocient befindet sich an der Spitze dieses Bereichs mit seiner fortschrittlichen Hyperscale-Datenlagertechnologie.
Heute stellte Ocient neue Funktionen vor, die seine Hyperscale-Datenplattform speziell für geospatial Analytics sowie maschinelles Lernen (ML) und künstliche Intelligenz (KI) erweitern. Das neu hinzugefügte OcientGeo-Feature umfasst eine umfassende Bibliothek geospatialer Funktionen und einen global optimierten räumlichen Index. Dies ermöglicht Unternehmen, große Mengen historischer und Echtzeit-geospatialer Daten effizient zu erfassen und zu analysieren, um verwertbare Erkenntnisse zu gewinnen. Integrierte ML-Tools beschleunigen zudem geospatial KI-Initiativen.
Ocient nutzt optimierten Speicher und Verarbeitung, um den Anforderungen hyperskalierter Daten gerecht zu werden, ohne sich auf GPUs zu verlassen. "Unser Fokus liegt auf Hyperscale-Workloads. Bei einer durchschnittlichen Ocient-Abfrage - sei es SQL, maschinelles Lernen oder geospatial - betrachten wir typischerweise rund eine Billion Elemente", erklärte Ocient-CEO Chris Gladwin.
Hyperscale-Datenanalyse: Fluss über GPUs
Während viele Organisationen die Leistung mit GPUs optimieren, verfolgt Ocient eine andere Strategie. "Der Schlüssel zu unserem Erfolg ist ein außergewöhnliches Maß an Parallelisierung", so Gladwin. "Es ist nicht ungewöhnlich, dass über eine Million paralleler Aufgaben in jeder Ebene des Stacks ausgeführt werden."
Um diese umfassende Parallelisierung in seinem Datenlager zu erreichen, betont Ocient den Fluss. Gladwin vermerkte, dass bei maschinellen Lernalgorithmen für Clustering, Regression und Klassifikation die Einschränkungen häufig nicht von CPU-Berechnungen, sondern von der rechnerischen Dichte abhängen — insbesondere von der Notwendigkeit eines höheren Verarbeitungsaufwands pro Terabyte Daten.
Die Haupt-Herausforderung besteht darin, einen ausreichenden Durchsatz im gesamten Rechen-Stack zu gewährleisten, einschließlich Speicher und Speicher. Dies steht im Mittelpunkt der technischen Innovation von Ocient, da sich das Unternehmen auf die Optimierung von Speicher- und schnellen SSD-Systemen spezialisiert hat. "Unsere Ingenieure schätzen GPUs — sie sind beeindruckend — aber wir haben einfach keinen Bedarf dafür festgestellt", bemerkte Gladwin.
Maschinelles Lernen im Hyperscale mit OcientML
Das Datenlager von Ocient konzentrierte sich zunächst auf SQL-Datenabfragen, und die gleichen architektonischen Vorteile, die schnelle Analysen auf umfangreichen Datensätzen ermöglichen, unterstützen nun auch OcientML und OcientGeo.
Gladwin betonte, dass OcientML es Kunden ermöglicht, maschinelles Lernen auf Datensätzen mit Milliarden oder Billionen von Datenpunkten durchzuführen, wobei überlegene Preis-Leistungs-Verhältnisse im Vergleich zu Alternativen angeboten werden. Funktionen wie das Workload-Management gewährleisten einen gerechten Ressourcenzugang über verschiedene Hyperscale-Abfragen und Analysen hinweg. Darüber hinaus ist OcientML in das Ocient Hyperscale Data Warehouse integriert, was die Notwendigkeit eliminiert, Daten extrahieren, transformieren und in eine separate Plattform laden zu müssen.
Die Vorteile von OcientML umfassen eine verbesserte Modellgenauigkeit durch volle Interaktion mit historischen und aktuellen Daten, beschleunigte Iterationen durch die Beseitigung unnötiger Datenbewegungen und einen reibungslosen Betrieb durch die Verwaltung von SQL und ML innerhalb eines einheitlichen Systems.
OcientGeo folgt einem ähnlichen Ansatz und ist integraler Bestandteil des Ocient Hyperscale Data Warehouse. Mit OcientGeo können Benutzer geospatial-Abfragen und -Analysen auf umfangreichen Datensätzen direkt innerhalb der Ocient-Umgebung durchführen, ohne große Datenextraktionen vornehmen zu müssen. Diese Fähigkeit ermöglicht die Ausführung geospatialer Abfragen mit Billionen von Datenpunkten in Sekundenschnelle.
"Wir beginnen gerade erst, diese neuen Anwendungen zu erforschen, die nur durch eine zehnfache oder mehr Verbesserung der Preis-Leistung hyperskalierter Analysen ermöglicht werden können", schloss Gladwin.