Entdecken Sie, wie Apples neueste KI-Forschung Ihr iPhone-Erlebnis revolutionieren könnte.

Apple an der Spitze der KI-Revolution

Apple, bekannt für technologische Innovationen, führt erneut den Weg in der künstlichen Intelligenz an. Kürzlich stellte das Unternehmen aus Cupertino bedeutende Fortschritte in der KI-Forschung mit zwei bahnbrechenden Arbeiten vor, die neue Techniken zur Erstellung von 3D-Avataren und zur Optimierung der Inferenz von Sprachmodellen präsentieren. Diese Entwicklungen versprechen, immersive visuelle Erlebnisse zu bieten und anspruchsvolle KI-Systeme nahtlos auf Verbrauchgeräten wie dem iPhone und iPad zu betreiben.

Immersive 3D-Avatare mit HUGS

Das erste Forschungspapier präsentiert HUGS (Human Gaussian Splats), eine Methode zur Erstellung animierter 3D-Avatare aus kurzen monokularen Videos (mit einer einzelnen Kamera aufgenommen). Der Hauptautor Muhammed Kocabas erklärt: „Unsere Methode verarbeitet ein Video mit nur 50-100 Frames und trennt automatisch den statischen Hintergrund von einem animierbaren menschlichen Avatar in weniger als 30 Minuten.“

HUGS nutzt eine effiziente Rendering-Technik namens 3D Gaussian Splatting, um sowohl das menschliche Modell als auch die Hintergrundszene darzustellen. Das Modell basiert anfänglich auf der statistischen Körperform SMPL, aber HUGS ermöglicht Anpassungen und erfasst Details wie Kleidung und Haare. Ein neuartiges neuronales Deformationsmodul sorgt für realistische Animationen durch lineare Blend-Skinning und erzeugt reibungslose Bewegungen ohne Artefakte. Kocabas ergänzt, dass HUGS die Synthese neuer Posen und die Generierung neuer Perspektiven sowohl für menschliche Avatare als auch deren Umgebungen erleichtert.

Im Vergleich zu früheren Methoden erreicht HUGS Trainings- und Rendering-Geschwindigkeiten von bis zu 100 Mal schneller. Nach nur 30 Minuten Optimierung auf einer Standard-Gaming-GPU sind die Ergebnisse fotorealistisch und übertreffen die Qualität der 3D-Rekonstruktion modernster Techniken wie Vid2Avatar und NeuMan.

Diese innovative Technologie ermöglicht es Nutzern, digitale Avatare mit nur einem Video in neue Szenen einzufügen und Bilder 60 Mal pro Sekunde zu aktualisieren, um ein flüssiges und realistisches Erlebnis zu schaffen. Stellen Sie sich vor, Sie erstellen dynamische 3D-Szenen direkt von Ihrem iPhone!

Optimierung der KI-Inferenz-Effizienz

Im zweiten Papier befassen sich Apples Forscher mit einer entscheidenden Herausforderung bei der Bereitstellung großer Sprachmodelle (LLMs) auf Geräten mit begrenztem Speicher. Fortschrittliche Sprachmodelle wie GPT-4 haben Hunderte von Milliarden Parametern, was sie auf Verbrauchshardware kostspielig macht.

Das vorgeschlagene System minimiert den Datentransfer vom Flash-Speicher zum begrenzten DRAM während der Inferenz. Hauptautor Keivan Alizadeh erklärt: „Wir haben ein Inferenzkostenmodell entwickelt, das mit dem Verhalten von Flash-Speicher übereinstimmt, wodurch wir den Datentransfer optimieren und größere Datenmengen lesen können.“

Die Forschung stellt zwei Haupttechniken vor: „Windowing“, das kürzlich verwendete Aktivierungen wiederverwendet, und „Row-Column Bundling“, das größere Datenblöcke verarbeitet, indem Zeilen und Spalten gemeinsam organisiert werden. Auf einer Apple M1 Max CPU verbessern diese Methoden die Inferenzlatenz um das 4- bis 5-Fache, während die GPU-Leistung um 20-25 Mal gesteigert wird.

Mitautor Mehrdad Farajtabar sagt: „Dieser Durchbruch ist entscheidend für die Bereitstellung fortschrittlicher LLMs in ressourcenbeschränkten Umgebungen und erhöht deren Zugänglichkeit.“ Diese Optimierungen könnten es komplexen KI-Assistenten und Chatbots ermöglichen, reibungslos auf iPhones, iPads und anderen mobilen Geräten zu funktionieren.

Apples strategische Vision

Diese Innovationen unterstreichen Apples Engagement für KI-Forschung und -Anwendungen. Experten warnen jedoch vor übermäßiger Begeisterung und betonen die Notwendigkeit einer verantwortungsvollen Integration von Technologien in Verbraucherprodukte, insbesondere in Bezug auf Datenschutz und mögliche Missbräuche.

Während Apple weiterhin diese Fortschritte integriert, verbessert es nicht nur seine Geräte, sondern antizipiert auch zukünftige Anforderungen an KI-gesteuerte Dienstleistungen. Die Optimierung komplexer KI-Modelle für Geräte mit begrenztem Speicher könnte den Weg für eine neue Welle von Anwendungen ebnen, die zuvor als nicht umsetzbar galten.

Durch die Veröffentlichung dieser Forschung trägt Apple auch zur breiteren KI-Community bei und fördert die weitere Entwicklung in diesem Bereich. Diese Initiative spiegelt Apples Vertrauen als Technologieführer wider und zeigt sein Engagement, die Grenzen der Innovation zu verschieben.

Wenn diese Fortschritte bedacht angegangen werden, könnte Apples neueste Entwicklung die Landschaft der künstlichen Intelligenz neu definieren. Fotorealistische digitale Avatare und leistungsstarke KI-Assistenten auf tragbaren Geräten, einst für unrealistisch gehalten, sind dank Apples wegweisender Arbeit nun in greifbarer Nähe.

Most people like

Find AI tools in YBX