„Eine neue Ära der mobilen KI.“ So bewirbt Samsung seine kommende Galaxy S24-Smartphone-Serie. Auf dem bevorstehenden Unpacked-Event verspricht das Unternehmen „ein völlig neues mobiles Erlebnis, das von KI befeuert wird.“
Samsung ist nicht der erste Hersteller, der die derzeitige Aufregung um KI-Plattformen wie ChatGPT und Midjourney nutzt. Große Akteure im Bereich Smartphone-Prozessoren—Qualcomm und MediaTek—haben kürzlich die beeindruckenden Möglichkeiten der generativen KI ihrer neuesten Flaggschiff- und Mittelklasse-Chips präsentiert.
Es ist klar, dass KI die Smartphone-Werbung dominieren wird. Aber was können wir tatsächlich erwarten? Der Mehrwert dieser sogenannten „KI-Fortschritte“ bleibt ungewiss und könnte einfach darin bestehen, vorhandene Funktionen unter neuen Namen oder in neuen Apps neu zu verpacken.
Die Galaxy S24-Serie wird mit dem Snapdragon 8 Gen 3 Chip von Qualcomm ausgestattet sein. Dieser Chip-Hersteller macht erhebliche Aussagen über seine generativen KI-Funktionen und behauptet, Bilder aus Textbefehlen in weniger als einer Sekunde mit Hilfe der Stable-Diffusion-Technologie zu erzeugen. Qualcomm hat detailliert erklärt, wie es Stable Diffusion für den Einsatz auf Geräten optimiert hat. Währenddessen behauptet MediaTek, dass der Dimensity 9300 ebenfalls nahezu sofortige Text-zu-Bild-Generierung über Stable Diffusion ermöglichen wird. Interessanterweise erwähnt das iQoo 12, das bereits mit Qualcomms neuestem Chip ausgestattet ist, diese generativen KI-Funktionen nicht in seiner Werbung.
Nehmen wir an, Samsung wird die Text-zu-Bild-Generierung anbieten—was wird diese Funktion letztendlich erreichen? Es bleibt unklar, ob diese Fähigkeit in einer Drittanbieter-App oder einer von Samsung eigenen integriert wird. Die zentrale Frage bleibt, wie dies die alltägliche Smartphone-Nutzung verbessern wird. Was würde ein typischer Galaxy S24-Nutzer mit KI-generierten Bildern, die aus einfachen Textaufforderungen erstellt wurden, anfangen? Möglicherweise verwenden sie sie, um Gespräche aufzupeppen oder um Aufsehen in sozialen Medien zu erregen.
Allerdings gibt es dabei Herausforderungen. Nutzer müssten Bilder aus Text generieren, dann lokal speichern oder in die Zwischenablage kopieren und schließlich in ihre bevorzugte Chat-App einfügen. Eine ideale Lösung wäre, wenn Samsung diese Bildgenerierung direkt in die Tastatur integrieren würde. Doch man könnte sich fragen, warum man diesen Prozess durchlaufen sollte, wenn Emojis, GIFs und Sticker einen ähnlichen Effekt erzielen könnten. Zudem könnte die Ausgabeauflösung von 512 x 512 Pixel für Aufgaben wie College-Arbeiten oder Präsentationen nicht ausreichen. Darüber hinaus könnten Kosten anfallen; MediaTeks Demonstration nennt eine Premium-Option. Galaxy S24-Nutzer könnten auf Tokens zur Text-zu-Bild-Generierung beschränkt sein, was zu langsamerer Leistung oder Abonnementgebühren führen könnte, wenn festgelegte Kontingente überschritten werden.
Falls dies der Fall ist, wirft es Fragen zur Praktikabilität auf, da andere Lösungen, wie OpenAIs DALL-E, bereits verfügbar sind. Nutzer können kostenlos Bilder generieren oder sich für ChatGPT Plus anmelden, um mit dem neuesten DALL-E 3-Modell schnellere und qualitativ hochwertigere Ergebnisse zu erzielen. Qualcomm behauptet, dass der Snapdragon 8 Gen 3 das „erste Modell ist, das multimodale Gen-KI-Modelle unterstützt“, was bedeutet, dass der native Chatbot (basierend auf dem Llama-Modell von Meta) Eingaben über Text, Bilder und Sprache akzeptiert. Dies ist jedoch nicht bahnbrechend, da ähnliche Funktionen bereits in ChatGPT-4 existieren, allerdings mit Abonnementanforderungen.
Eine weitere interessante Funktion, die Qualcomm anpreist, ist die KI-Bilderweiterung, die es Nutzern ermöglicht, die Leinwand eines Bildes in jede Richtung zu erweitern. Die generative KI des Geräts würde intelligent Pixel basierend auf den Aufforderungen des Nutzers erzeugen und neue Elemente zur Szene hinzufügen. Auch wenn dies beeindruckende Fähigkeiten demonstriert, besteht das Risiko, persönliche Fotos mit wertvollen Erinnerungen durch unrealistische Darstellungen zu verzerren.
Zusammenfassungen sind ein weiteres zentrales Anwendungsfeld für generative KI auf Geräten. Dies könnte die Art und Weise verbessern, wie Nutzer über aktuelle Ereignisse informiert bleiben. Seine Effektivität hängt jedoch von der Benutzerfreundlichkeit ab; wenn Nutzer beispielsweise Nachrichtenartikel zusammenfassen könnten, ohne zu einer anderen App wechseln zu müssen, würde dies die Erfahrung erheblich verbessern.
Andere vorgeschlagene Funktionen, wie sprachbasiertes Foto-Editing, klingen zwar praktisch, doch es ist schwierig, ihren tatsächlichen Wert zu beurteilen, wenn aktuelle Optionen wie Ein-Tasten-Filter bereits schnelle und zufriedenstellende Bearbeitungserlebnisse bieten. Bei grundlegenden Funktionen wie der Generierung generischer Chat-Antworten oder dem Erhalten von Antworten, die normalerweise Internetrecherchen erfordern, treten erneut Herausforderungen auf.
Die generativen KI-Modelle, die nativ auf Smartphones laufen, wie Metas Llama, sind nicht die fortschrittlichsten, hauptsächlich aufgrund begrenzter Ressourcen. Nehmen wir Google als Beispiel; das Pixel 8 Pro nutzt eine Basismodellversion seiner großen Sprachmodelle namens Gemini Nano. Warum nicht ein leistungsfähigeres Modell wählen, wie ChatGPT oder Pi, über spezielle mobile Apps?
Derzeit könnte die praktischste Anwendung generativer KI darin bestehen, die Abhängigkeit von Cloud-Diensten zu reduzieren, Offline-Aufgaben zu ermöglichen und gleichzeitig den Datenschutz zu erhöhen. Ideal wäre es, wenn diese Gerätewerkzeuge nahtlos mit bestehenden virtuellen Assistenten wie Google Assistant, Alexa oder Siri integriert werden. Stellen Sie sich vor, Sie instruieren Ihren KI-Assistenten, alle Katzenbilder aus Ihrer Galerie für Ihren Vater zu einem Collage zusammenzustellen oder einen Disneyland-Ausflug zu planen, einschließlich der besten Ticketpreise und einer ordentlichen Google-Kalender-Agenda.
Wenn generative KI auf Geräten die Nutzerdaten lokal speichert, könnte dies eine Umgebung des Datenschutzes fördern—zumindest theoretisch. Für den Moment bleibt das Versprechen von Samsungs KI-Fähigkeiten ungewiss. Es wird spannend sein zu sehen, ob Samsung bedeutende generative KI-Erlebnisse bieten kann oder lediglich eine Sammlung von auffälligen, aber unpraktischen Funktionen bereitstellt.