Auf der kürzlich stattgefundenen Google Next-Veranstaltung kündigte Google ein bedeutendes Update seines KI-Modells Gemini 1.5 Pro an, das mit beispiellosen Audioverarbeitungsfähigkeiten ausgestattet ist. Nun kann Gemini 1.5 Pro hochgeladene Audiodateien direkt interpretieren und analysieren, um wertvolle Informationen aus Gewinnberichten oder Videotonspuren zu extrahieren, ohne dass schriftliche Transkripte erforderlich sind.
Ein zentrales Highlight dieses Updates ist, dass Gemini 1.5 Pro in der Leistung Gemini Ultra übertroffen hat, das zuvor als das leistungsstärkste Modell der Reihe galt. Google erklärte, dass dieses Modell komplexe Befehle verstehen kann, ohne dass eine Feinabstimmung nötig ist, was einen bedeutenden Fortschritt in der KI-Technologie darstellt.
Es ist wichtig zu beachten, dass der Zugang zu Gemini 1.5 Pro auf Benutzer mit Fähigkeiten in Vertex AI und AI Studio beschränkt ist. Die meisten Nutzer interagieren mit den Sprachmodellen von Gemini über den Gemini-Chatbot, während Gemini Ultra die fortschrittlicheren Gemini-Chatbots unterstützt. Obwohl Gemini Ultra robust ist, erreicht es nicht die Geschwindigkeit von Gemini 1.5 Pro.
Darüber hinaus stellte Google Updates zu einem weiteren großen KI-Modell, Imagen 2, vor. Dieses fortschrittliche System zur Text-zu-Bild-Generierung verbessert die Bildfähigkeiten von Gemini und ermöglicht es den Benutzern, Elemente innerhalb von Bildern hinzuzufügen oder zu entfernen. Google führte außerdem SynthID ein, eine digitale Wasserzeichnungsfunktion für alle mit dem Imagen-Modell erstellten Bilder, die ein unsichtbares Zeichen zur Kennzeichnung der Bildquelle einbettet.
Zusätzlich gab Google einen Ausblick auf eine neue Methode, die KI-Antworten mit Google Search integriert, um Antworten auf der Basis von Echtzeitinformationen zu liefern. Dies bedeutet, dass große Sprachmodelle aktuelle Daten bereitstellen können, anstatt sich ausschließlich auf vorhandene Informationen zu stützen. Allerdings hat Google beschlossen, Gemini die Beantwortung von Fragen zu den US-Wahlen 2024 zu untersagen, was ein Bekenntnis zu einem verantwortungsvollen Umgang mit sensiblen Informationen widerspiegelt.
Es ist erwähnenswert, dass Gemini Kritik für die Generierung ungenauer Bilder historischer Persönlichkeiten erhalten hat, was uns daran erinnert, dass trotz der Fortschritte in der KI-Technologie Vorsicht im Umgang mit historischen und realen Daten geboten ist.