Der rasante Fortschritt der KI bringt zahlreiche Herausforderungen mit sich, darunter die Datenaufbereitung, das Management großer Datensätze, die Gewährleistung der Datenqualität und die Ineffizienzen bei langwierigen Abfragen und Batch-Prozessen. In diesem VB Spotlight teilen William Benton, Principal Product Architect bei NVIDIA, und weitere Experten, wie Unternehmen ihre Analyseprozesse heute optimieren können.
Das transformative Potenzial der KI wird oft durch die Komplexität der Analysen und die lange Wartezeit auf Einblicke aus Abfragen behindert.
„Jeder hat wahrscheinlich schon mal Dashboards mit Verzögerungen erlebt“, bemerkt Deborah Leff, Chief Revenue Officer bei SQream. „Bei komplexen Abfragen kann man stundenlang oder sogar tagelang warten, um wichtige Einblicke zu erhalten.“
Während einer kürzlich stattgefundenen VB Spotlight-Veranstaltung haben Leff, Benton und der Datenwissenschaftler Tianhui „Michael“ Li darüber diskutiert, wie Unternehmen Hindernisse in der Datenanalyse auf Unternehmensebene überwinden können. Sie betonten die dringende Notwendigkeit, in leistungsstarke GPUs zu investieren, um die Geschwindigkeit, Effizienz und Möglichkeiten der Analyseprozesse zu verbessern und so einen neuen Ansatz für datengestützte Entscheidungen zu schaffen.
Die Beschleunigung der Unternehmensanalyse
Trotz der Begeisterung für generative KI hat die Unternehmensanalyse in ihrem Fortschritt zurückgelegen.
„Viele gehen weiterhin mit veralteten Architekturen an Analyseherausforderungen heran“, erklärt Benton. „Obwohl Datenbanken inkrementelle Updates erfahren haben, haben wir keinen revolutionären Wandel erlebt, der Praktikern, Analysten und Datenwissenschaftlern deutlich zugutekommt.“
Diese anhaltende Herausforderung ergibt sich aus der erheblichen Zeit, die für Analysen benötigt wird, wodurch effektive Lösungen außer Reichweite bleiben. Während die Hinzufügung weiterer Cloud-Ressourcen kostspielig und kompliziert ist, kann eine effektive Kombination aus CPU- und GPU-Power die Analyseleistung deutlich steigern.
Heutige GPUs wären in der Vergangenheit als außergewöhnlich angesehen worden, so Benton. „Während Supercomputer für massive wissenschaftliche Probleme eingesetzt werden, kann diese enorme Rechenleistung nun auch verschiedenen Anwendungsfällen zugutekommen.“
Unternehmen müssen sich nicht mehr mit kleineren Abfrageoptimierungen begnügen. Stattdessen können sie den gesamten Analysezeitraum erheblich verkürzen, was die Geschwindigkeit bei der Datenaufnahme, Abfragen und Präsentation verbessert.
„SQream und ähnliche Technologien nutzen die kombinierte Leistung von GPUs und CPUs und revolutionieren traditionelle Analyseprozesse mit einem beispiellosen Einfluss“, fügt Benton hinzu.
Revolutionierung des Data Science-Ökosystems
Unstrukturierte Datenpools, meist basierend auf Hadoop, bieten Flexibilität für große Mengen semi-strukturierter und unstrukturierter Daten, erfordern jedoch umfassende Vorbereitungen vor der Modellbereitstellung. SQream nutzt GPUs zur beschleunigten Datenverarbeitung, was den Workflow von der Datenvorbereitung bis zu umsetzbaren Einblicken erheblich optimiert.
„Die Fähigkeiten von GPUs ermöglichen es Unternehmen, riesige Datensätze effektiv zu analysieren“, behauptet Leff. „Oft mussten wir Datenmengen begrenzen, aber GPUs erlauben es uns, enorme Datenvolumen zu erschließen.“
NVIDIA’s RAPIDS, ein Open-Source-Paket für GPU-beschleunigte Bibliotheken, verbessert die Leistung in großem Maßstab innerhalb von Datenpipelines. Es nutzt die Kraft der parallelen Verarbeitung und erhöht die Effizienz in den Python- und SQL-Datenwissenschaft-Ökosystemen.
Tiefere Einblicke erschließen
Benton hebt hervor, dass verbesserte Analysen nicht nur um Geschwindigkeit geht. „Langsame Prozesse resultieren häufig aus Kommunikationsverzögerungen zwischen Teams oder sogar Schreibtischen. Durch die Optimierung dieser Interaktionen sehen wir erhebliche Leistungsgewinne.“
Die Erreichung von Antwortzeiten von weniger als einer Sekunde ermöglicht sofortige Antworten und hält Datenwissenschaftler in einem produktiven Fluss. Diese Effizienz auf verschiedene Führungskräfte auszudehnen, verbessert den Entscheidungsprozess, der sich direkt auf Einnahmen, Kostenmanagement und Risikominderung auswirkt.
Das vollständige Potenzial der Daten wird durch die Kombination von CPUs und GPUs nutzbar, wodurch zuvor unmögliche Abfragen möglich werden.
„Für mich ist das die Demokratisierung der Beschleunigung“, bemerkt Leff. „Viele Entscheidungsträger müssen auf veraltete Annahmen zurückgreifen. Wenn gesagt wird, dass eine Anfrage acht Stunden dauert, akzeptieren sie das, ohne zu wissen, dass sie in weniger als acht Minuten bearbeitet werden könnte.“
Benton fügt hinzu: „Viele Unternehmen klammern sich an alte Paradigmen, die über Jahrzehnte etabliert wurden. Mit den Fortschritten, die durch Technologien wie SQream möglich sind, können wir diese Annahmen in Frage stellen. Wenn eine Abfrage, die einst zwei Wochen dauerte, nun in einer halben Stunde abgeschlossen werden kann, öffnet das die Tür, um neue Geschäftsmöglichkeiten zu erkunden.“