Google startet Gemini 1.5 in den Flash- und Pro-Versionen mit einem Token-Limit von 2 Millionen für den öffentlichen Zugriff.

Home KI-Nachrichten Google startet Gemini 1.5 in den Flash- und Pro-Versionen mit einem Token-Limit von 2 Millionen für den öffentlichen Zugriff.

Google Cloud hat zwei Versionen seines herausragenden KI-Modells eingeführt: Gemini 1.5 Flash und Gemini 1.5 Pro. Gemini 1.5 Flash ist ein kompaktes multimodales Modell mit einem Kontextfenster von 1 Million Tokens und wurde für hochfrequente Aufgaben entwickelt. Es wurde im Mai auf der Google I/O präsentiert und steht nun Entwicklern zur Verfügung. Das leistungsstärkere Gemini 1.5 Pro, das im Februar vorgestellt wurde, bietet ein beeindruckendes Kontextfenster von 2 Millionen Tokens und gilt als die fortschrittlichste Version von Googles großem Sprachmodell (LLM) bis heute.

Die Einführung dieser Gemini-Varianten zeigt, wie Googles KI-Technologie Unternehmen dabei unterstützen kann, innovative KI-Agenten und Lösungen zu entwickeln. In einer kürzlichen Pressekonferenz betonte Google Cloud CEO Thomas Kurian den "unglaublichen Schwung" bei der Einführung generativer KI und stellte fest, dass große Organisationen—darunter Accenture, Airbus und Goldman Sachs—auf der Plattform von Google aufbauen. Kurian führt diesen Anstieg auf die Fähigkeiten von Googles Modellen in Verbindung mit der Vertex-Plattform zurück, die schnelle Fortschritte in beiden Bereichen verspricht.

Gemini 1.5 Flash

Gemini 1.5 Flash bietet Entwicklern geringere Latenzzeiten, kosteneffiziente Preise und ein Kontextfenster, das sich ideal für Anwendungen wie Einzelhandels-Chat-Agenten und Dokumentenverarbeitung eignet. Google behauptet, dass Gemini 1.5 Flash im Durchschnitt 40 % schneller als GPT-3.5 Turbo bei der Verarbeitung von Eingaben mit 10.000 Zeichen ist. Darüber hinaus bietet es Kosten, die viermal niedriger sind als die des OpenAI-Modells, und unterstützt Kontext-Caching für Eingaben über 32.000 Zeichen.

Gemini 1.5 Pro

Gemini 1.5 Pro verfügt über ein einzigartiges Kontextfenster von 2 Millionen Tokens, das es ihm ermöglicht, umfangreichere Texte zu analysieren und umfassende Antworten zu generieren. Kurian erklärt, dass diese Fähigkeit es Benutzern ermöglicht, umfangreiche Inhalte einzugeben, wie beispielsweise ein zweistündiges HD-Video oder über 60.000 Codezeilen, ohne sie in kleinere Segmente zerlegen zu müssen. Viele Unternehmen entdecken bereits den erheblichen Nutzen, den die verbesserte Verarbeitungsleistung dieses Modells bietet.

Kurian unterscheidet weiter zwischen den beiden Modellen basierend auf den Bedürfnissen der Benutzer: Gemini 1.5 Pro eignet sich hervorragend für die Verarbeitung umfangreicher Inhalte, während Flash besser für Anwendungen mit niedriger Latenz geeignet ist.

Kontext-Caching für Gemini 1.5

Um Entwicklern zu helfen, das Potenzial von Geminis Kontextfenstern voll auszuschöpfen, führt Google das Kontext-Caching ein, das jetzt für beide Modelle in der öffentlichen Vorschau verfügbar ist. Diese Funktion ermöglicht es Modellen, zuvor verarbeitete Informationen zu speichern und wiederzuverwenden, was die Rechenkosten erheblich senkt—um bis zu 75 %—da die Notwendigkeit entfällt, Antworten für lange Gespräche oder Dokumente neu zu berechnen.

Provisionierte Durchsatzkapazität für Gemini

Die neu verfügbare Funktion der provisionierten Durchsatzkapazität ermöglicht Entwicklern, ihre Nutzung von Gemini-Modellen effizient zu skalieren, indem sie die Anzahl der Abfragen verwalten, die ein Modell über die Zeit hinweg bewältigen kann. Diese Option bietet im Vergleich zum vorherigen Pay-as-you-go-Modell eine verbesserte Vorhersehbarkeit und Zuverlässigkeit. Kurian wies darauf hin, dass provisionierte Durchsatzkapazität es Kunden ermöglicht, Inferenzkapazitäten zu reservieren, um eine konsistente Leistung selbst bei Spitzenbelastungen, wie sie bei großen Veranstaltungen in sozialen Medien auftreten, sicherzustellen.

Die provisionierte Durchsatzkapazität ist nun allgemein verfügbar und bietet Entwicklern größere Kontrolle über ihre Produktionsarbeitslasten sowie Servicelevel-Garantien hinsichtlich Antwortzeiten und Verfügbarkeit.

Axelera sichert sich 68 Millionen Dollar Finanzierung, um im Edge-AI-Chip-Markt mit Nvidia zu konkurrieren.

Google's Imagen 3: Verbesserte Text-zu-Bild-Grundlage jetzt auf Vertex AI verfügbar

Most people like

Fotor

15.6M

Entdecken Sie den ultimativen KI-Fotoeditor, der Ihr Fotografiererlebnis auf ein neues Level hebt. Dieses hochmoderne Tool nutzt fortschrittliche künstliche Intelligenz, um Ihre Bilder mühelos zu verbessern und das Bearbeiten schneller und intuitiver als je zuvor zu gestalten. Egal, ob Sie ein professioneller Fotograf oder ein Anfänger sind, dieser leistungsstarke Editor bietet eine nahtlose Möglichkeit, Ihre Fotos in atemberaubende Kunstwerke zu verwandeln.

Fotobearbeitung AI Photo & Image Generator

UChat

26.8K

UChat ist eine innovative Chatbot-Plattform, die es Unternehmen ermöglicht, ihre Abläufe mühelos zu automatisieren, ganz ohne Programmierkenntnisse.

Chatbot-Plattform AI Chatbot

getimg.ai

2.3M

Entdecken Sie eine faszinierende Suite von KI-Tools, die zum Erstellen, Bearbeiten und Verbessern von Bildern entwickelt wurden. Entfalten Sie Ihre Kreativität mit unseren leistungsstarken Funktionen, die Ihre künstlerischen Visionen zum Leben erwecken.

KI-Kunstwerkzeuge AI Art Generator

RADAAR

78.4K

Entdecken Sie RADAAR, die All-in-One-Plattform für das Social Media Management, die für Marken, Agenturen und Start-ups entwickelt wurde. Optimieren Sie Ihre Online-Präsenz, steigern Sie das Engagement und verbessern Sie Ihre Marketingmaßnahmen mit den leistungsstarken Funktionen von RADAAR, die auf vielfältige Bedürfnisse zugeschnitten sind.

Social-Media-Management AI Social Media Assistant

Find AI tools in YBX