Das Transformer-basierte Robotersystem der UC Berkeley passt sich nahtlos an unbekannte Umgebungen an.

Forscher der Universität Kalifornien, Berkeley, haben ein innovatives Steuersystem für humanoide Roboter entwickelt, das es ihnen ermöglicht, mühelos durch verschiedene Gelände und Hindernisse zu navigieren. Dieses KI-geheizte System orientiert sich an den Deep-Learning-Frameworks, die große Sprachmodelle (LLM) revolutioniert haben. Das grundlegende Prinzip ist einfach: Durch die Analyse recent Beobachtungen kann die KI zukünftige Zustände und Handlungen vorhersagen.

Vollständig in Simulation trainiert, zeigt das System eine starke Leistung unter unvorhersehbaren realen Bedingungen. Durch die Bewertung vergangener Interaktionen passt es sein Verhalten dynamisch an, um neue Szenarien effektiv zu bewältigen, die während des Trainings nicht auftraten.

Ein Roboter für alle Terrains

Humanoide Roboter, die den Menschen nachempfunden sind, haben das Potenzial, wertvolle Assistenten zu werden, die verschiedene physische und kognitive Aufgaben übernehmen können. Die Schaffung vielseitiger humanoider Roboter stellt jedoch erhebliche Herausforderungen dar, insbesondere bei der Entwicklung eines flexiblen Steuersystems.

Traditionelle Robotersteuerungssysteme sind oft wenig anpassungsfähig, da sie für spezifische Aufgaben konzipiert wurden und Schwierigkeiten haben, die Unberechenbarkeit realer Terrains und visueller Bedingungen zu bewältigen. Diese Starrheit schränkt ihren Nutzen auf kontrollierte Umgebungen ein.

Daher gewinnt die forschungsbasierte Methode zur Robotersteuerung zunehmend an Bedeutung. Solche Systeme können ihr Verhalten basierend auf Daten aus Simulationen oder direkten Umwelteinwirkungen anpassen.

Das Steuersystem der U.C. Berkeley verspricht, humanoide Roboter durch eine Vielzahl von Szenarien sicher zu navigieren. Eingesetzt auf Digit, einem vollwertigen, vielseitigen humanoiden Roboter, beweist dieses System außergewöhnliche Gehfähigkeiten im Freien und meistert zuverlässig alltägliche menschliche Umgebungen wie Gehwege, Bürgersteige und offene Felder. Der Roboter meistert verschiedene Oberflächen wie Beton, Gummi und Gras, ohne zu fallen.

Die Forscher berichten: „Wir haben festgestellt, dass unser Controller über alle getesteten Terrains zuverlässig laufen konnte, und waren zuversichtlich, ihn ohne Sicherheitsvorrichtung einzusetzen. Während einer Woche Tests in Außenbereichen haben wir keine Stürze beobachtet.“

Darüber hinaus wurde der Roboter rigoros auf seine Widerstandsfähigkeit gegenüber Störungen getestet. Er meistert unerwartete Stufen, zufällige Objekte auf seinem Weg und sogar Geschosse, während er seine Stabilität beim Schieben oder Ziehen aufrechterhält.

Robotersteuerung mit Transformatoren

Obwohl verschiedene humanoide Roboter beeindruckende Fähigkeiten zeigen, zeichnet sich dieses neue System durch seine Trainings- und Einsatzmethodik aus.

Das KI-Steuerungsmodell wurde rein in Simulation trainiert und nutzte dabei Tausende von Domänen und zig Milliarden Szenarien im Isaac Gym, einer leistungsstarken physikalischen Simulationsumgebung. Diese umfassende simulierte Erfahrung überträgt sich nahtlos in reale Anwendungen, ohne zusätzliche Feinabstimmung, ein Prozess, der als Sim-to-Real-Transfer bekannt ist. Bemerkenswerterweise zeigte das System emergente Fähigkeiten in realen Szenarien, wie das Navigieren über Stufen, die im Training nicht explizit behandelt wurden.

Zentral für dieses System ist ein „kausaler Transformator“, ein Deep-Learning-Modell, das historische propriozeptive Beobachtungen und Handlungen verarbeitet. Dieser Transformator erkennt effektiv die Relevanz spezifischer Informationen – wie Gangmuster und Kontaktzustände – die für die Beobachtungen des Roboters von Bedeutung sind.

Transformatoren, die für ihren Erfolg in großen Sprachmodellen bekannt sind, sind besonders gut darin, folgende Elemente in umfangreichen Datenfolgen vorherzusagen. Der in diesem Roboter verwendete kausale Transformator lernt aus Beobachtungs- und Handlungsequenzen und ermöglicht es ihm, die Konsequenzen seines Verhaltens vorauszusehen und sich dynamisch an unterschiedliche Landschaften, einschließlich unbekannter, anzupassen.

Die Forscher erklären: „Wir hypothesieren, dass die Historie von Beobachtungen und Handlungen implizit Informationen über die Welt kodiert, die ein leistungsstarkes Transformator-Modell nutzen kann, um sein Verhalten dynamisch in Testsituationen anzupassen.“ Dieses Konzept, das als „In-Context-Adaption“ bezeichnet wird, ähnelt der Art und Weise, wie Sprachmodelle kontextspezifische Informationen verwenden, um neue Aufgaben zu erlernen und Ausgaben während der Inferenz zu verfeinern.

Transformatoren haben sich als überlegen gegenüber anderen sequenziellen Modellen wie zeitlichen Faltungsnetzwerken (TCN) und langem Kurzzeitspeicher (LSTM) erwiesen. Ihre Architektur unterstützt die Skalierbarkeit mit zusätzlicher Datenanzahl und Rechenressourcen und kann durch die Integration verschiedener Eingabemodalitäten optimiert werden.

Im vergangenen Jahr haben sich Transformatoren als wertvolle Werkzeuge innerhalb der Robotikgemeinschaft etabliert, wobei mehrere Modelle ihre Vielseitigkeit nutzen, um die Fähigkeiten von Robotern zu verbessern. Sie bieten erhebliche Vorteile, darunter eine verbesserte Kodierung verschiedener Modalitäten und die Übersetzung von hochrangigen Anweisungen in natürliche Sprache in spezifische Planungs-Schritte für Roboter.

Die Forscher schließen: „Analog zu Bereichen wie Vision und Sprache glauben wir, dass Transformatoren unseren zukünftigen Fortschritt bei der Skalierung von Lernansätzen für echte humanoide Lokomotion unterstützen könnten.“

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles