Eingeschränkter Zugang zu LLMs? Snowflake stellt länderübergreifende Inferenz für verbesserte Verfügbarkeit vor.

Home KI-Nachrichten Eingeschränkter Zugang zu LLMs? Snowflake stellt länderübergreifende Inferenz für verbesserte Verfügbarkeit vor.

Die regionale Verfügbarkeit großer Sprachmodelle (LLMs) kann den Wettbewerbsvorteil erheblich steigern – ein schnellerer Zugang fördert die Innovation. Im Gegensatz dazu laufen diejenigen, die warten müssen, Gefahr, zurückzufallen.

Der schnelle Fortschritt in der KI-Entwicklung zwingt Organisationen häufig dazu, die Einführung aufzuschieben, bis Modelle in ihren Technologie-Stack integriert sind. Diese Verzögerung ist meist auf Ressourcenengpässe, westlich orientierte Voreingenommenheiten und mehrsprachige Herausforderungen zurückzuführen.

Um dieses dringende Problem zu lösen, hat Snowflake die allgemeine Verfügbarkeit von Regionen übergreifendem Inferenz auf Cortex AI bekanntgegeben. Mit einer einfachen Konfiguration können Entwickler jetzt Anfragen in verschiedenen Regionen bearbeiten, selbst wenn ein bestimmtes Modell lokal nicht verfügbar ist. Dies ermöglicht eine nahtlose Integration neuer LLMs, sobald sie zugänglich sind.

Organisationen können LLMs sicher in den USA, der EU sowie im Asien-Pazifik-Raum und Japan (APJ) nutzen, ohne zusätzliche Ausgaben für Datentransfer zu riskieren.

„Die Regionen übergreifende Inferenz auf Cortex AI ermöglicht es Ihnen, sich nahtlos mit dem LLM Ihrer Wahl zu integrieren, unabhängig von der regionalen Verfügbarkeit“, erklärt Arun Agarwal, Leiter des AI-Produktmarketings bei Snowflake.

Aktivierung der Cross-Region-Inferenz

Die Funktionalität zur Überwindung von Regionen muss für die Datenübertragung aktiviert werden; die Einstellungen sind standardmäßig deaktiviert. Entwickler müssen die Regionen für die Inferenz angeben. Wenn beide Regionen unter Amazon Web Services (AWS) operieren, erfolgt die Datenübertragung sicher über das globale Netzwerk von AWS und profitiert von automatischer physischer Verschlüsselung. Bei unterschiedlichen Cloud-Anbietern wird der Datenverkehr über das öffentliche Internet mit verschlüsselter mutual transport layer security (MTLS) geleitet. Es ist wichtig zu beachten, dass Eingaben, Ausgaben und von den Diensten generierte Aufforderungen nicht gespeichert oder zwischengespeichert werden; die Inferenzverarbeitung findet ausschließlich in der übergreifenden Umgebung statt.

Um Antworten sicher innerhalb des Snowflake-Rahmenwerks zu generieren, müssen die Benutzer zunächst eine kontospezifische Einstellung festlegen, die definiert, wo die Inferenz stattfinden soll. Cortex AI identifiziert dann automatisch eine geeignete Region für die Verarbeitung, wenn ein angefordertes LLM in der Quellregion nicht verfügbar ist.

Wenn beispielsweise ein Benutzer den Parameter auf „AWSUS“ setzt, kann die Inferenz sowohl in der US-Ost- als auch in der US-Westregion stattfinden. Eine Einstellung auf „AWSEU“ ermöglicht die Weiterleitung in die zentrale EU oder Nordost-Asien-Pazifikregion. Derzeit können Zielregionen nur innerhalb von AWS konfiguriert werden; wenn die Regionsübergreifung in Azure oder Google Cloud aktiviert wird, werden die Anfragen dennoch über AWS verarbeitet.

Agarwal veranschaulicht dies mit einem Szenario rund um Snowflake Arctic. Wenn das Modell in der Quellregion (AWS US East) nicht verfügbar ist, leitet die übergreifende Inferenz die Anfrage an AWS US West 2 weiter, und die Antwort wird an die ursprüngliche Region zurückgesendet.

„All das kann mit einer einzigen Zeile Code erledigt werden“, merkt Agarwal an.

Benutzer werden für die in der Quellregion verbrauchten LLM-Einheiten belastet – nicht für die übergreifende Region. Die Latenz zwischen den Regionen wird durch die Infrastruktur- und Netzwerkbedingungen beeinflusst, jedoch erwartet Snowflake, dass diese Latenz im Vergleich zur Latenz der LLM-Inferenz vernachlässigbar sein wird.

Imperial College London und DeepMind präsentieren verkörperte Agenten, die mit minimalen Daten lernen können.

86 % der Unternehmen verzeichnen ein Umsatzwachstum von 6 % durch Generative KI, so eine Umfrage von Google Cloud.

Most people like

Upheal

100.4K

Entdecken Sie die Kraft unserer KI-gesteuerten Plattform, die speziell für Fachkräfte im Bereich der psychischen Gesundheit entwickelt wurde. Maßgeschneidert zur Verbesserung therapeutischer Praktiken, optimiert dieses innovative Werkzeug das Kundenmanagement, bietet aufschlussreiche Analysen und fördert eine effektive Kommunikation, wodurch die Unterstützung des psychischen Wohlbefindens neu definiert wird. Schließen Sie sich der Bewegung an, die die psychische Gesundheitsversorgung mit modernster Technologie transformiert, die Fachleuten die Möglichkeit gibt, optimale Ergebnisse für ihre Klienten zu erzielen.

KI AI Notes Assistant

LearnGPT

134K

Präsentation einer KI-gesteuerten Plattform, die mühelos umfangreiche Bücher zu jedem Thema erstellt. Erleben Sie die Kraft fortschrittlicher Technologie, die es Ihnen ermöglicht, tiefgehende schriftliche Inhalte schnell und einfach zu erstellen, unabhängig vom Thema.

KI Other

SynthMind.app

44K

In der heutigen, schnelllebigen Welt ist der Zugang zu zeitnahen und präzisen Informationen entscheidend für fundierte Entscheidungen. Unsere von KI unterstützten Sofortforschungsberichte bieten umfassende Einblicke in Rekordzeit und ermöglichen es Unternehmen und Einzelpersonen, der Konkurrenz einen Schritt voraus zu sein. Durch die Nutzung der Möglichkeiten künstlicher Intelligenz liefern wir maßgeschneiderte Forschung, die Ihr Verständnis komplexer Themen vertieft und es Ihnen ermöglicht, mühelos informierte Entscheidungen zu treffen. Tauchen Sie ein in eine Welt der schnellen Forschung und erleben Sie die Zukunft der Informationsbeschaffung noch heute!

KI-gestützte Berichte Large Language Models (LLMs)

Slite

353.7K

Entdecken Sie Slite, eine KI-gestützte Wissensdatenbank, die Ihnen einen nahtlosen Zugang zu zuverlässigen Unternehmensinformationen direkt zur Verfügung stellt.

KI-gestützte Wissensdatenbank AI Knowledge Base

Find AI tools in YBX