Galileo Revolutioniert die KI-Bewertung mit Luna: Ein Wendepunkt für Unternehmen
Galileo, ein Vorreiter im Bereich generative KI für Unternehmen, hat Galileo Luna vorgestellt, eine bahnbrechende Suite von Evaluation Foundation Models (EFMs), die darauf abzielt, die Bewertung generativer KI-Systeme in Unternehmen zu transformieren. Luna löst wesentliche Herausforderungen – Geschwindigkeit, Kosten und Genauigkeit – die bisher die Einführung generativer KI in Produktionsumgebungen behindert haben.
„Galileo hat Luna entwickelt, um die Mängel bestehender GenAI-Bewertungsmethoden zu überwinden, die oft langsam, teuer und ungenau sind“, erklärte Vikram Chatterji, Mitbegründer und CEO von Galileo. „Wir haben den Bedarf an ultra-niedrigen Latenzzeiten, kosteneffizienten und hochgenauen Bewertungen in Produktionsumgebungen erkannt.“
Ein wichtiger Meilenstein in der KI-Bewertung
Die Einführung von Luna ist ein entscheidender Schritt für Galileo, das seit Anfang 2021 im Bereich enterprise GenAI aktiv ist. Das Engagement des Unternehmens für die Weiterentwicklung von KI-Bewertungen zeigt sich in fast einem Jahr intensiver Forschung und Entwicklung, die in der Entwicklung von Luna mündete.
Luna beweist überragende Leistungen in einem Benchmark-Test mit einem AUROC-Score von 0,78, der führende Wettbewerber wie GPT-3.5, Trulens Groundedness und RAGAS Faithfulness übertrifft.
Zweckgebundene Modelle setzen neue Maßstäbe
Im Zentrum der Innovation von Luna stehen gezielt entwickelte kleine Sprachmodelle, die speziell für Bewertungsaufgaben wie Halluzinationserkennung, Kontextqualitätsbewertung, Datenleckverhinderung und Identifizierung bösartiger Eingaben konzipiert sind. Dieser spezialisierte Ansatz ermöglicht es Luna, in drei entscheidenden Kennzahlen – Geschwindigkeit, Kosten und Genauigkeit – zu glänzen.
„Durch den Einsatz maßgeschneiderter kleiner Sprachmodelle erzielt Luna Bewertungen, die 97 % günstiger und 11x schneller sind als die von GPT-3.5“, erklärte Chatterji. Zudem übertrifft Luna frühere Methoden um bis zu 20 % bei der Erkennung von Problemen wie Halluzinationen und personenbezogenen Daten (PII).
In einer Kostenanalyse für die Bewertung von 1 Million Abfragen pro Monat verursacht Luna lediglich 175 USD, was es erheblich kostengünstiger macht als GPT-3.5 (6.248 USD), RAGAS Faithfulness (7.994 USD) und Trulens Groundedness (16.641 USD).
Innovation ohne herkömmliche Datensätze
Ein herausragendes Merkmal von Luna ist die Fähigkeit, ohne traditionelle Ground-Truth-Datensätze zu arbeiten. Durch die Nutzung vorab trainierter Bewertungsmodelle, die auf verschiedenen domänen-spezifischen Datensätzen verfeinert wurden, vereinfacht Luna den Bewertungsprozess und beseitigt die Notwendigkeit zeitaufwändiger individueller Testsets.
Die potenziellen Anwendungsgebiete von Luna sind vielfältig. Chatterji bemerkte, dass sie in Branchen, die hohe Zuverlässigkeit erfordern, wie Gesundheitswesen, Finanzwesen und Telekommunikation, äußerst effektiv ist. „Luna ist besonders leistungsstark für große Unternehmensanwendungen, die monatlich Millionen von Abfragen verarbeiten“, fügte er hinzu.
Unübertroffene Geschwindigkeit und kontinuierliche Verbesserung
Galileos Luna bietet außergewöhnliche Geschwindigkeit und verarbeitet eine einzelne Abfrage in nur 0,232 Sekunden, was eine erhebliche Verbesserung gegenüber Wettbewerbern wie GPT-3.5 (2,5 Sekunden) und RAGAS Faithfulness (5,4 Sekunden) darstellt.
Anwendungsfälle für Luna reichen von der Überwachung von KI-Ausgaben in Echtzeit bis zur Sicherstellung der Sicherheit von Chatbot-Interaktionen. Mit dem Fine Tune-Produkt von Galileo kann Luna an spezifische Kundenbedürfnisse angepasst werden und erzielt in kritischen Sektoren wie Pharmazie und Finanzdienstleistungen Genauigkeitswerte von 95 % oder mehr.
Während sich die Landschaft der generativen KI weiterentwickelt, bleibt Galileo der kontinuierlichen Innovation mit Luna verpflichtet und konzentriert sich darauf, die Aufgabenunterstützung zu erweitern, die Genauigkeit zu verbessern und Kosten sowie Latenzzeiten weiter zu reduzieren.
„Galileo setzt sich dafür ein, die KI-Bewertung voranzutreiben und Organisationen bei der Implementierung vertrauenswürdiger KI-Lösungen zu unterstützen“, sagte Chatterji. „Da sich generative KI weiterentwickelt, werden wir unseren Kunden modernste Fähigkeiten bieten, die Vertrauen bei den Nutzern schaffen.“
Mit der Einführung von Luna hat Galileo seine Position als Vorreiter in der Bewertung generativer KI für Unternehmen gestärkt. Während Unternehmen das Potenzial generativer KI nutzen wollen, werden Lunas schnelle, kosteneffektive und präzise Bewertungen entscheidend zur breiten Akzeptanz dieser transformierenden Technologie beitragen.