Vor Google I/O 2024 war die Vorfreude auf die möglichen KI-Ankündigungen von Google groß. Die Veranstaltung begann mit einem energiegeladenen Auftritt des YouTube-Stars Marc Rebillet, der auf ungewöhnliche Weise aus einer riesigen Tasse in einem Bademantel auftauchte.
Mit diesem fröhlichen Auftakt forderte Rebillet die Zuschauer auf, kreative musikalische Ideen zu teilen, die durch Googles KI-DJ-Software zum Leben erweckt wurden. Diese lebhafte Eröffnung deutete bereits auf den Schwerpunkt des Events, die künstliche Intelligenz, hin. CEO Sundar Pichai stellte fest, dass der Begriff „KI“ insgesamt 121 Mal erwähnt wurde.
Am Ende der Veranstaltung blieben zwei zentrale Fragen offen: Kümmert sich Google mit seinen neuesten Angeboten um Probleme, die den Alltag der Menschen nicht wirklich beeinflussen, und gibt es einen rentablen Markt für spezialisierte KI-Hardware, die Hunderte von Euro kostet, wenn Smartphones bereits beeindruckende KI-Funktionen bieten?
Bewertung von KI-Geräten
Aktuell gibt es spannende KI-Gadgets, vom Rabbit R1 über den Humane AI Pin bis hin zu KI-gestützten Anhängern. Ihre Funktionen sind unterschiedlich: Einige hören zu, andere führen Gespräche, tätigen Anrufe, zeichnen Videos auf und verbinden sich mit gesprächigen KI-Chatbots zur Interpretation ihrer Umgebung. Während diese Geräte innovativ sind, haben ihre Benutzererfahrungen oft enttäuscht. Mobile Section Editor Joe Maring beschreibt den Rabbit R1 als eines der schlechtesten Gadgets, die er je ausprobiert hat, und auch der Humane AI Pin schneidet nicht besser ab. Obwohl es sich um Geräte der ersten Generation handelt, bleibt ihre Zukunft angesichts der jüngsten Erkenntnisse von KI-Riesen wie OpenAI und Google ungewiss.
Die Entwicklung des KI-Bewusstseins
Die Fähigkeiten der KI entwickeln sich rasant weiter, insbesondere in der Visionstechnologie, die es ermöglicht, die Welt durch eine Kamera zu interpretieren. Auf Google I/O 2024 stellte Google Gemini Live vor, nachdem OpenAI GPT-4o, ein multimodales Modell zur Verbesserung der KI-Verarbeitungsfähigkeiten von Text, Audio und Bildern, lanciert hatte. Beide Produkte zielen auf eine nahtlose Benutzerinteraktion ab: Die Kamera auf fast alles richten, und die KI liefert kontextbezogene Informationen. Sie kann die Angemessenheit von Kleidung bewerten, Objekte übersetzen und sogar verlorene Gegenstände wie Autoschlüssel finden.
Obwohl die Erfahrungen mit ChatGPT und Gemini Live unterschiedlich sind, teilen sie grundlegende Fähigkeiten. Dies ist ein entscheidender Moment, in dem die Diskrepanz zwischen KI auf Smartphones und spezialisierter Hardware deutlich wird.
Die Herausforderung der Hardware
Der Rabbit R1 und der Humane AI Pin sind mit 8MP bzw. 12MP Kameras ausgestattet, die eine gewisse Bildverarbeitung ermöglichen. Im Vergleich zu den fortschrittlichen, stabilisierten Kameras moderner Smartphones können sie jedoch nicht bestehen. Ein reguläres Smartphone verbessert das Verständnis der KI, indem es hochwertige visuelle Daten liefert, was zu einem viel klareren Ergebnis führt – vergleichbar mit dem Videobild zwischen Budget- und Premium-Smartphones.
Zudem nutzen diese KI-Geräte Chips der mittleren Preisklasse von MediaTek und Qualcomm und bieten nicht die Rechenleistung, die zeitgenössische Smartphones besitzen und AI-Aufgaben wesentlich schneller erledigen können. Nutzer möchten nicht 15 Sekunden auf eine Antwort warten, wenn selbst ein einfacher Sprachassistent Anfragen viel schneller verwalten kann.
Generative KI funktioniert auf zwei Hauptarten: durch Cloud-Verarbeitung, die eine Internetverbindung erfordert, oder durch Offline-Verarbeitung, wie Googles Gemini Nano auf Pixel 8 und einigen Samsung-Geräten. Letzteres ermöglicht es der KI, ohne Internetzugang zu arbeiten, jedoch gibt es derzeit keine eigenständigen KI-Geräte, die ohne Internetverbindung agieren.
Die Vorteile von On-Device-KI
Mit On-Device-KI-Funktionen können Nutzer beispielsweise die Audio-Transkription auf Pixel-Handys nutzen, ohne auf eine Internetverbindung angewiesen zu sein. Technologien wie Googles Neural Machine Translation ermöglichen Echtzeitübersetzungen, und noch in diesem Jahr wird Gemini Nano mit Multimodalität lokale Verarbeitungsfunktionen bieten, die kontextbezogene Antworten basierend auf Kamera- und Mikrofoneingaben liefern.
Dieser Ansatz ist nicht nur schneller, sondern erhöht auch die Datensicherheit, da persönliche Informationen auf dem Gerät bleiben und nicht online übertragen werden. Zudem könnten die Kosten für die Bereitstellung generativer KI-Funktionen gesenkt werden, was Verbraucherbedenken hinsichtlich der Erschwinglichkeit inmitten des KI-Booms angeht.
Die Integration von Gemini in Googles Dienste
Die Bedeutung der Integration wird deutlich in Googles Dienstesuite, einschließlich Gmail, Docs, Drive, Maps, Photos und Search. Gemini bietet maßgeschneiderte KI-Assistenten für spezifische Aufgaben, die mit diesen Diensten in Einklang stehen. Nutzer können Gemini zur Reiseplanung einbeziehen, relevante E-Mails abrufen und diese Daten mit Google Search für umfassende Reisepläne kombinieren. Für Nutzer, die Gemini Advanced wählen, stehen noch mehr Funktionen zur Verfügung, wie das Verarbeiten umfangreicher PDFs, Codes und Multimedia, das Zusammenfassen und Bereitstellen wichtiger Einblicke.
Gemini verbessert Aufgaben direkt innerhalb der Apps, was es ermöglicht, unauffällig zu bleiben und den Nutzern in Echtzeit effektiv zu helfen.
Die Vorteile von Smartphones gegenüber spezialisierten KI-Geräten
Ein KI-Assistent sollte praktische Unterstützung bieten und dabei Funktionalität und Komfort ausbalancieren. Er muss relevante Daten nutzen, um persönliche und berufliche Aufgaben zu optimieren, ohne zusätzliche Kosten zu verursachen. Aktuelle KI-Gadgets wie der Rabbit R1 und der Humane AI Pin können dieses Versprechen aufgrund ihrer Einschränkungen nicht einlösen. Angesichts der fortschrittlichen Fähigkeiten von Smartphones – und ihrer Fähigkeit, anspruchsvolle KI-Anwendungen ohne die Nachteile spezialisierter Hardware auszuführen – erscheint es unklug, in suboptimale Geräte zu investieren, wenn Nutzer sich auf ihre Telefone für überlegene Leistung verlassen können.
In der sich entwickelnden KI-Landschaft übernehmen Smartphones die Führung und machen eigenständige KI-Geräte zunehmend überflüssig.