Wie humanoide Roboter Laufen lernen

Bild: DFKI, Annemarie Popp

Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts ‚VeryHuman‘ haben DFKI-Wissenschaftlerinnen und -Wissenschaftler daher einen Ansatz entwickelt, der subsymbolische und symbolische KI-Methoden kombiniert. Konkret nutzten sie symbolische Spezifikationen im Reinforcement Learning, bei dem ein System für mathematisch überprüfbare Ergebnisse belohnt wird. Dafür bündelten die zwei Bremer Forschungsbereiche Robotics Innovation Center, geleitet von Prof. Dr. Frank Kirchner, und Cyber-Physical Systems, geleitet von Prof. Dr. Rolf Drechsler, ihre Kompetenzen. Ziel war es, ein KI-basiertes Steuerungssystem für humanoide Roboter zu entwickeln, mit der menschenähnliche Fähigkeiten wie sicheres und stabiles Laufen oder andere komplexe Bewegungen erreicht werden können.

Belohnungsfunktionen abgeleitet

Durch die Verwendung symbolischer Spezifikationen, wie einer einfachen Sprache zur Beschreibung des Roboterverhaltens, ist es dem Projektteam gelungen, abstrakte kinematische Modelle zu erstellen, die mathematisch überprüft werden können. Diese Abstraktionen definieren Belohnungsfunktionen für das Reinforcement Learning und ermöglichen es dem Roboter, seine Entscheidungen anhand der Modelle zu verifizieren. Dadurch wird die Zuverlässigkeit der Entscheidungen erhöht, was stabile und vorhersehbare Roboterbewegungen ermöglicht und das Risiko von Fehlverhalten oder unerwarteten Aktionen reduziert. Zusätzlich wurde das gewünschte Roboterverhalten als hybrider Automat modelliert, ein mathematisches Modell, das sowohl kontinuierliches als auch diskretes Verhalten beschreibt. Dies reduziert den Zustandsraum des Systems und ermöglicht so ein effizienteres Lernen. Darüber hinaus ist es den Forschenden gelungen, dynamisches Laufen mit dem humanoiden Roboter ‚RH5‘ des DFKI zu realisieren. Dazu kombinierten sie die Methode des Nullmomentpunktes (der Punkt auf der Standfläche eines Roboters, an dem die resultierende Bodenkraft kein Kippmoment erzeugt) mit dem Ansatz der Ganzkörperregelung.

Da die präzise Modellierung und Optimierung von Bewegungsabläufen sowohl die Sicherheit als auch die Effizienz von Robotern erhöht, kann der entwickelte hybride KI-Ansatz nach Ansicht der Forschenden als Blaupause für die Generierung von Belohnungsfunktionen aus symbolischer, logikbasierter KI dienen. Weitere Infos erhalten unter nachstehendem Link. www.dfki.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert