Google hat offiziell sein fortschrittlichstes generatives KI-Modell, Gemini, für die Anforderungen der Unternehmensanwendungsentwicklung lanciert.
Letzte Woche vorgestellt, ist Gemini in drei Versionen erhältlich: Ultra, Pro und Nano. Die heutige Ankündigung macht die Pro-Version über eine API zugänglich, sodass Entwickler sie kostenlos mit bestimmten Nutzungsbeschränkungen verwenden können, wie in einem aktuellen Blogbeitrag erläutert.
Gemini Pro für Entwickler: Wichtige Funktionen
Entwickler können die erste Version von Gemini Pro über die Google AI Studio API nutzen, die eine webbasierte Plattform für die Erstellung von Prompts und die Beschaffung von API-Schlüsseln für die Anwendungsentwicklung bietet. Diese Version bietet ein Kontextfenster von 32K für die Textgenerierung, mit Plänen zur zukünftigen Erweiterung dieser Funktion.
Google hat auch einen speziellen multimodalen Endpunkt für Gemini Pro Vision eingeführt, der sowohl Text- als auch Bildeingaben akzeptiert und entsprechende Textausgaben liefert. In einem Beitrag auf X hob CEO Sundar Pichai die umfassenden Funktionen der Gemini API hervor, darunter Funktionsaufrufe, Embeddings, semantische Suche, benutzerdefinierte Wissensverankerung und Chat-Funktionen. Die API unterstützt 38 Sprachen in über 180 Ländern.
Gemini Pro wird ebenfalls in Vertex AI integriert, der End-to-End-KI-Plattform von Google Cloud, die Werkzeuge, vollständig verwaltete Infrastruktur sowie integrierte Datenschutz- und Sicherheitsfunktionen umfasst. Diese Integration ermöglicht Entwicklern den Übergang in eine verwaltete Umgebung nach Bedarf.
Das Unternehmen hat das Ziel, Feedback von Entwicklern zu sammeln, um Gemini Pro weiter zu verfeinern, während es auf die Einführung des komplexeren Gemini Ultra im nächsten Jahr hinarbeitet.
Kostenloser Zugang mit Einschränkungen
Aktuell bietet Google Gemini Pro und Gemini Pro Vision kostenlos an, mit einer Ratenbeschränkung von 60 Anfragen pro Minute. Dies gilt auch für Entwickler, die die Modelle in Vertex AI nutzen; dieser kostenlose Zugang ist jedoch nur bis zur allgemeinen Verfügbarkeit im nächsten Jahr verfügbar. Besonders bemerkenswert ist, dass Googles kostenloses Kontingent 20 Mal größer ist als die Angebote von Wettbewerbern und somit für die meisten Entwicklungsprojekte geeignet ist.
Sobald der Service vollständig verfügbar ist, werden die Preise basierend auf der Nutzung festgelegt, wobei pro 1.000 Zeichen oder Bilder Gebühren anfallen. Konkret beträgt der Preis für die Eingabe in Gemini Pro $0,00025 pro 1K Zeichen und $0,0025 pro Bild, während die Ausgabe bei $0,0005 pro 1K Zeichen bleibt.
Einige Nutzer auf X haben angemerkt, dass Googles Preismodell, das pro Zeichen berechnet, erheblich höher ist als die Modelle von Wettbewerbern wie OpenAI, die typischerweise pro Token berechnen – einer numerischen Darstellung, die ganze Wörter umfassen kann.
Verbesserungen in Vertex AI
Zusätzlich zur Einführung von Gemini Pro hat Google Vertex AI mit der neuesten Text-zu-Bild-Diffusionstechnologie, Imagen 2, aktualisiert. Dieses Upgrade bietet Funktionen zur Erstellung einer breiten Palette kreativer und realistischer Logos, Embleme und Wortmarken und verbessert gleichzeitig die Ergebnisse bei der Textdarstellung in mehreren Sprachen.
Darüber hinaus gab Google die Verfügbarkeit von MedLM bekannt, einer Familie von Grundmodellen, die für den Gesundheitssektor fein abgestimmt sind und über Vertex AI für in den USA ansässige Organisationen bereitgestellt werden. Dieses neue Angebot baut auf dem früheren Grundmodell Med-PaLM 2 auf, mit einem bald erwarteten Upgrade basierend auf Gemini.