Google stärkt aktiv seine Gemini-Reihe und bereitet sich auf die Veröffentlichung von Version 2.0 vor. Heute hat das Unternehmen zwei neue Iterationen vorgestellt: den Gemini 1.5 Flash-8B, eine kleinere Variante des Gemini 1.5, sowie aktualisierte Versionen von Gemini 1.5 Flash und Gemini 1.5 Pro. Laut Google zeigen diese Modelle erhebliche Verbesserungen in verschiedenen internen Benchmarks, mit deutlichen Leistungssteigerungen für 1.5 Flash und erweiterten Fähigkeiten in Mathematik, Programmierung und komplexen Anfragen für 1.5 Pro.
„Gemini 1.5 Flash ist derzeit die beste Option für Entwickler weltweit“, erklärte Logan Kilpatrick, Produktleiter für Google AI Studio, in einem Beitrag auf X.
Neueste experimentelle Iterationen der Gemini-Modelle
Der im Mai veröffentlichten Gemini 1.5 Flash wurde entwickelt, um lange Kontexte zu verwalten und kann detaillierte Informationen aus über 10 Millionen Token analysieren. Dies ermöglicht die Verarbeitung umfangreicher multimodaler Eingaben, einschließlich Dokumenten, Videos und Audiodateien.
Die neu verfügbare Variante mit 8 Milliarden Parametern von Gemini 1.5 Flash sorgt für ein verbessertes Nutzererlebnis, während das aktualisierte Gemini 1.5 Pro die Leistung in der Programmierung und bei komplexen Aufgaben steigert und als unkomplizierter Ersatz für das im August gestartete vorherige Modell dient.
Kilpatrick erwähnte, dass in den kommenden Wochen eine produktionsreife Version erwartet wird, die voraussichtlich Evaluierungsfunktionen enthalten wird. Er betonte, dass diese experimentellen Modelle entscheidend sind, um das Feedback der Entwickler zu sammeln und schnelle Updates zu ermöglichen.
Die neuesten Iterationen von Gemini 1.5 Flash und Pro verfügen über ein Limit von 1 Million Token und sind für kostenlose Tests über Google AI Studio und die Gemini API verfügbar. Zukünftig sollen sie auch im Vertex AI-Experimentierpunkt integriert werden. Es wird ein kostenloses Tier angeboten, und eine baldige Produktionsversion ist in Aussicht.
Ab dem 3. September wird Google Anfragen automatisch auf das neue Modell umleiten und die ältere Version aus Google AI Studio und der API zurückziehen, um Verwirrung zu vermeiden. „Wir sind gespannt auf Ihre Meinungen und darauf, wie dieses Modell neue multimodale Anwendungsmöglichkeiten eröffnet“, teilte Kilpatrick auf X mit.
Ohnegleichen: Die Skala von Gemini 1.5
Die Forscher von Google DeepMind beschreiben die Skala von Gemini 1.5 als „beispiellos“ unter zeitgenössischen Sprachmodellen. Kilpatrick äußerte Dankbarkeit für den Enthusiasmus der Community für das zunächst experimentelle Modell, das Anfang dieses Monats veröffentlicht wurde, und hob die harte Arbeit hervor, die in die Umsetzung dieser Innovationen geflossen ist.
Geteilte Meinungen zu den aktuellen Updates
Das Feedback der Community ist gemischt – von begeistertem Lob bis hin zu Skepsis. In einem kürzlichen Update der Rangliste durch die Large Model Systems Organization (LMSO) sprang Gemini 1.5 Flash von Platz 23 auf Platz 6 basierend auf 20.000 Community-Stimmen und demonstrierte so seine Wettbewerbsfähigkeit mit Modellen wie Llama und übertraf einige ältere Angebote von Google.
Während einige Nutzer „solide Verbesserungen“, insbesondere in der Bildanalyse, bemerkten, wurden auch kritische Stimmen laut. Einige hinterfragten die Häufigkeit der Updates und forderten eine substanzielle Version wie Gemini 2.0. Andere äußerten, dass die neue Veröffentlichung an "fauler Codierkrankheit" leide, ähnlich den Problemen, die bei GPT-4 Turbo berichtet wurden, und behaupteten, sie kämpfe mit längeren Ausgaben und Kohärenz.
Kommentare zu Googles Namenswahl wurden ebenfalls laut, wobei Nutzer humorvoll die Kreativität der Modellnamen in Frage stellten. Der Diskurs über die Gemini-Modelle entwickelt sich weiter und spiegelt die Komplexität der KI-Entwicklung und die Erwartungen der Nutzer wider.