Entdecken Sie Reliable AI: Das neue Tool von Enkrypt identifiziert die sichersten LLMs für Ihre Bedürfnisse.

Home KI-Nachrichten Entdecken Sie Reliable AI: Das neue Tool von Enkrypt identifiziert die sichersten LLMs für Ihre Bedürfnisse.

Im Zeitalter der generativen KI ist die Gewährleistung der Sicherheit großer Sprachmodelle (LLMs) ebenso entscheidend wie deren Leistungsfähigkeit in verschiedenen Aufgaben. Weltweit erkennen Teams zunehmend die Notwendigkeit dieser Sicherheitsmaßnahmen und verbessern ihre Test- und Evaluierungsprozesse, um Probleme zu identifizieren und zu beheben, die zu schlechten Benutzererfahrungen, verpassten Chancen oder regulatorischen Strafen führen könnten.

Angesichts der schnellen Entwicklung von Open- und Closed-Source-Modellen kann es herausfordernd sein, das sicherste LLM auszuwählen. Enkrypt bietet eine Lösung mit seinem LLM Safety Leaderboard. Dieses in Boston ansässige Startup hat sich auf die Bereitstellung einer Kontrollschicht für den sicheren Einsatz generativer KI spezialisiert und LLMs nach ihrer Anfälligkeit für Sicherheits- und Zuverlässigkeitsrisiken eingestuft.

Das Leaderboard enthält zahlreiche leistungsstarke Sprachmodelle, darunter die Familien GPT und Claude. Es liefert wertvolle Einblicke in die Risikofaktoren, die für die Auswahl sicherer und zuverlässiger LLMs sowie die Optimierung ihrer Implementierung unerlässlich sind.

Verständnis des LLM Safety Leaderboard von Enkrypt

Wenn Unternehmen LLMs in Anwendungen wie Chatbots einsetzen, führen sie kontinuierliche interne Tests durch, um Sicherheitsrisiken wie Jailbreaks und voreingenommene Ausgaben zu identifizieren. Selbst kleinste Fehler können zu erheblichen Problemen führen, einschließlich Datenlecks oder verzerrten Antworten, wie der Vorfall mit dem Google Gemini-Chatbot gezeigt hat. Diese Risiken können in regulierten Sektoren wie Fintech und Gesundheitswesen noch ausgeprägter sein.

Gegründet im Jahr 2023, begegnet Enkrypt diesen Herausforderungen mit Sentry, einer umfassenden Lösung, die Schwachstellen in generativen KI-Anwendungen aufdeckt und automatisierte Schutzmaßnahmen implementiert. Das LLM Safety Leaderboard ist der nächste Schritt in dieser Initiative und bietet Einblicke, die Teams helfen, von Anfang an das sicherste Modell auszuwählen.

Das Leaderboard, das durch rigorose Tests in verschiedenen Szenarien entwickelt wurde, bewertet bis zu 36 LLMs – sowohl Open- als auch Closed-Source – basierend auf verschiedenen Sicherheits- und Schutzmetriken. Es bewertet die Fähigkeit des Modells, schädliche, voreingenommene oder unangemessene Inhalte zu vermeiden sowie Angriffe durch Malware oder Eingabeaufforderungen zu verhindern.

Welches LLM hat den Titel für die größte Sicherheit?

Stand 8. Mai, führt OpenAI’s GPT-4-Turbo Enkrypts Leaderboard als das sicherste LLM mit dem niedrigsten Risiko-Score von 15,23. Dieses Modell wehrt erfolgreich Jailbreak-Angriffe ab und erzeugt nur in 0,86 % der Fälle toxische Ausgaben. Allerdings hat es Schwierigkeiten mit Voreingenommenheit und Malware, die in 38,27 % bzw. 21,78 % der Fälle auftreten.

Die Modelle Llama2 und Llama3 von Meta folgen dicht dahinter mit Risiko-Scores zwischen 23,09 und 35,69. Anthropic’s Claude 3 Haiku belegt mit einem Risiko-Score von 34,83 den 10. Platz und zeigt in den Tests eine respektable Leistung, liefert jedoch in über 90 % der Fälle voreingenommene Antworten.

Am unteren Ende des Leaderboards stehen Saul Instruct-V1 und das neu angekündigte Phi3-Mini-4K von Microsoft mit Risiko-Scores von 60,44 und 54,16. Mixtral 8X22B und Snowflake Arctic erhalten ebenfalls niedrige Rankings von 28 und 27.

Es ist erwähnenswert, dass diese Liste Änderungen unterliegt, da Modelle verbessert werden und neue hinzukommen. Enkrypt plant, das Leaderboard regelmäßig zu aktualisieren, um diese Entwicklungen widerzuspiegeln.

„Unser Leaderboard wird am Tag Null nach neuen Modelleinführungen und wöchentlich bei Modifikationen aktualisiert. Mit dem Fortschritt der KI-Sicherheitsforschung und der Entwicklung neuer Methoden wird das Leaderboard kontinuierlich die neuesten Ergebnisse präsentieren. Dies gewährleistet seine Relevanz und Autorität als Ressource“, erklärte Sahi Agarwal, Mitbegründer von Enkrypt.

Agarwal sieht diese sich entwickelnde Liste als nützliches Werkzeug für Unternehmens-Teams, um die Stärken und Schwächen beliebter LLMs zu erkunden – sei es bei der Minderung von Voreingenommenheit oder der Verhinderung von Eingabeaufforderungen – und um informierte Entscheidungen basierend auf ihren spezifischen Anwendungsfällen zu treffen.

„Die Integration unseres Leaderboards in die KI-Strategie verbessert die technologischen Fähigkeiten und wahrt gleichzeitig ethische Standards, wodurch ein Wettbewerbsvorteil entsteht und Vertrauen aufgebaut wird. Das Risiko-/Sicherheits-/Governance-Team kann das Leaderboard nutzen, um zu erkennen, welche Modelle von Produkt- und Ingenieurteams sicher verwendet werden können. Derzeit fehlen umfassende Sicherheitsinformationen, die lediglich auf öffentlichen Leistungsmetriken basieren. Das Leaderboard bietet zusammen mit Berichten der Red Teams wichtige Sicherheitsempfehlungen für die Modellimplementierung“, fügte er hinzu.

Atlan sichert sich 105 Millionen USD Finanzierung, um das ‘Datenchaos’ in Unternehmen mit einer einheitlichen Kontrollplattform zu bekämpfen.

Altera sichert sich 9 Millionen Dollar zur Weiterentwicklung von KI-Technologie für digitale Menschen

Most people like

GenPPT - AI PowerPoint Generator

20K

Verwandeln Sie Ihren Präsentationsprozess mit GenPPT – erstellen Sie in kürzester Zeit beeindruckende Folien!

KI-Präsentationsgenerator AI Presentation Generator

1PX.AI

5.5K

Präsentieren Sie unsere hochmoderne KI-Plattform zur Erstellung von Fotos und Avataren, wo Innovation auf Kreativität trifft! Mit fortschrittlicher Technologie können Benutzer mühelos beeindruckende, personalisierte Bilder und Avatare erstellen. Egal, ob Sie Ihre Online-Präsenz verbessern, einzigartige Grafiken für soziale Medien entwerfen oder einfach Ihr kreatives Potenzial erkunden möchten, unsere Plattform verwandelt Ihre Ideen in wenigen Minuten in hochwertige visuelle Inhalte. Tauchen Sie ein in eine Welt voller Möglichkeiten und entdecken Sie, wie einfach es ist, fesselnde Fotos und Avatare zu generieren, die Ihrem Stil entsprechen!

KI-Fotogenerator AI Photo & Image Generator

Elium

17.3K

In der heutigen schnelllebigen digitalen Landschaft spielt eine Wissensaustauschplattform eine entscheidende Rolle bei der Nutzung kollektiver Intelligenz. Indem sie einen zentralen Raum bieten, in dem Einzelpersonen und Organisationen Ideen und Ressourcen austauschen können, fördern diese Plattformen Zusammenarbeit und Innovation. Dies ermöglicht es den Nutzern nicht nur, auf vielfältige Erkenntnisse zuzugreifen, sondern fördert auch informierte Entscheidungsfindung und effektive Problemlösung. Begleiten Sie uns, während wir erkunden, wie eine robuste Wissensaustauschplattform die kollektive Intelligenz stärken und die Art und Weise, wie wir gemeinsam lernen und arbeiten, transformieren kann.

Wissensaustausch-Plattform AI Knowledge Management

Packback

983.2K

Entdecken Sie, wie unsere KI-Lernplattform die Bildung revolutioniert, indem sie anregende, forschungsbasierte Diskussionen fördert und Schreibaufgaben verbessert. Unsere Plattform, die sowohl für Lehrkräfte als auch für Studierende konzipiert ist, nutzt fortschrittliche KI-Technologie, um ein tieferes Verständnis und kritisches Denken zu ermöglichen. Lassen Sie uns gemeinsam eine dynamische Lernumgebung schaffen, in der Forschung zu besseren Schreibfähigkeiten und einem sinnvollen Dialog führt. Erkunden Sie das Potenzial KI-gestützter Einblicke, um die Art und Weise, wie Wissen geteilt und entwickelt wird, zu transformieren.

KI-Lernplattform Writing Assistants

Find AI tools in YBX