Kollisionsfrei unterwegs

Mit Hilfe von Reinforcement-Learning-Algorithmen können Roboter auch anspruchsvolle Bewegungen in einer unbekannten Umgebung und bei unbekannten Robotermodellen erlernen – doch wie kann man sicherstellen, dass sie Sicherheitsbeschränkungen respektieren, ohne dass sich ihre Performance verschlechtert?

Robotik

Damit RL-Agenten in Echtsituationen zum Einsatz kommen können, muss es daher zusätzliche Sicherheitsfunktionen geben, die möglichst Performance-freundlich sind. Dem Team von Wissenschaftlern ist es mit Hilfe des BRSL gelungen, die Sicherheit wesentlich zu erhöhen und gleichzeitig das System nur geringfügig einzuschränken. — Damit RL-Agenten in Echtsituationen zum Einsatz kommen können, muss es zusätzliche Sicherheitsfunktionen geben, die möglichst Performance-freundlich sind. Einem Team von Wissenschaftlern ist es mit Hilfe des BRSL gelungen, die Sicherheit wesentlich zu erhöhen und gleichzeitig das System nur geringfügig einzuschränken. – Bild: Amr Alanwar, TUM Campus Heilbronn GmbH

Das Reinforcement-Learning (RL) spielt eine zentrale Rolle für die Verbesserung von Sicherheitsfunktionen und Bewegungsabläufen bei autonomen Fahrzeugen, Lieferdrohnen oder anderen mobilen Robotersystemen. In autonomen mobilen Robotern übernehmen vernetzte, eingebettete Systeme wichtige Planungs- und Steuerungsaufgaben und berücksichtigen Informationen aus der Umgebung.

Eine grundlegende Herausforderung in der Robotik ist die Trajektorien- oder Bahnplanung. Sie zielt darauf ab, den kürzesten hindernisfreien Weg vom Start- zum Zielzustand zu finden. Der Pfad kann dabei eine beliebig große Menge von Zuständen (Position und Orientierung) oder Wegpunkten sein. Um dieses Planungsproblem lösen zu können, gibt es mehrere Ansätze. Sie werden hauptsächlich in zwei Kategorien eingeteilt: klassische Ansätze und lernbasierte Ansätze. Während Systeme bei dem klassischen Ansatz durch menschlichen Input trainiert werden, basieren selbstlernende Verfahren auf Datensets und künstlicher Intelligenz. Das RL bedeutet, dass ein System selbständig mit seiner Umgebung interagiert und lernt, indem es Rückmeldungen (Belohnungen oder Bestrafungen) für seine Handlungen erhält. In Folge werden Aktionen in ähnlichen Situationen durch den lernenden Agenten wiederholt oder vermieden.

Anhand des lernbasierten RL trainiert ein Robotersystem z.B. das Vermeiden von Kollisionen, indem sich das autonome und softwaregestützte System, der Agent, in seiner Umgebung bewegt und mit ihr interagiert. Durch Trial-und-Error bzw. Aktion und folgender Belohnung oder Bestrafung, kann das System sich somit mit Hilfe von Machine Learning kontinuierlich verbessern. Der Agent ist dabei durch Lernalgorithmen angewiesen, die kumulative langfristige Belohnung zu erhöhen. Entsprechende RL-Methoden werden für die Ausführung und Verbesserung anspruchsvoller Bewegungsabläufe in unsicheren Umgebungen eingesetzt. Allerdings fehlen modernen Deep-RL-Ansätzen in der Regel Sicherheitsgarantien, insbesondere wenn die Systemumgebung und das Robotermodell unbekannt sind. In solchen Szenarien gelten die Umgebung und das unbekannte Robotermodell als Black Box. Doch wie lassen Kollisionen auch in einem Black-Box-System verhindern?

Neuer Forschungsansatz: Sicherheit für Black-Box-Systeme

Mit dem Ziel, Sicherheitsgefahren noch zuverlässiger ausschließen zu können, werden derzeit in der Forschung im Bereich der Cyber-physischen Systeme (CPS) und der Robotersicherheit neue Ansätze untersucht, die bislang existierende RL-Methoden übertreffen. Um einen Serieneinsatz in großem Maßstab zu rechtfertigen, müssen Roboter Sicherheitsbeschränkungen in einer Weise einhalten können, die nicht zu gleichzeitigen Performanceeinbußen führt. Zu diesem Zweck haben Wissenschaftler der Technischen Universität München am Campus Heilbronn, zusammen mit Wissenschaftlern der Stanford University, den sogenannten Black-Box-Reachability-based Safety Layer (BRSL) entwickelt. Hierbei wird RL in Verbindung mit datengesteuerten Erreichbarkeitsanalysen zur Planung komplexer Handlungsabläufe genutzt, um Sicherheit auch für Black-Box-Systeme zu garantieren.

45 % weniger Footprint mit XTS

Mit PC-based Control und XTS reduziert Komax SLE den Maschinen-Footprint um 45 % und steigert Flexibilität in der Kabelverarbeitung. ‣ weiterlesen

Sicherheitgarantiertes Reinforcement Learning

Wie kann ein System mit einem auf Trial und Error basierendem RL geschult werden, ohne, dass es dabei zu realen Fehlern kommt? Um der Maschine beizubringen, sichere Aktionen auszuführen, wird ein sogenanntes sicherheitsgarantiertes RL durchgeführt. Der BRSL sorgt für Sicherheit, indem er die Gesamtheit aller möglichen Trajektorien des Roboters berechnet, die das Resultat einer bestimmten Aktion sind, ausgehend von den Ausgangspunkten. Wenn es eine mögliche Kollision zwischen der Menge der erreichbaren Zustände und einem Hindernis gibt, so wird die unsichere Aktion durch eine sichere Aktion ersetzt, die zu einer kollisionsfreien Aktion führt.

Wie läuft das konkret ab? Zunächst berechnet der Agent dafür eine mögliche Bewegungsbahn, unter Anwendung eines Regelsets und eines neuronalen Netzwerkes, das eine Blackbox-Umgebung abbildet und für diese trainiert wurde. Im nächsten Schritt wird die Bewegungsplanung so geändert, dass die Sicherheit durch datengesteuerte Erreichbarkeit und eine Kollisionsprüfung für den erreichbaren Bereich des Roboters gewährleistet ist. Sollte eine Kollisionsprüfung nicht in der erforderlichen Zeit durchführbar sein, wird ein sicheres Manöver ausgeführt. Anschließend wird der neue sichere Plan an den Roboter weitergegeben und dem RL-Agenten wird eine Strafe für die Wahl einer unsicheren Aktion auferlegt. Ein wichtiger Aspekt: Die Erreichbarkeitsanalyse verwendet hierfür ein Set an Störungsdaten, die offline für das Black-Box-Systemmodells gesammelt wurden. Online gesammelte Daten werden nur für das Training des Richtlinien- und Umgebungsmodells verwendet. Um den RL-Agenten in die Lage zu versetzen, dynamisch informierte Entscheidungen zu treffen, trainiert der BRSL auch ein Online-Umgebungsmodell, was jedoch die Sicherheitsgarantie nicht beeinträchtigt.

Moderne Einstiegslösungen in die Automatisierung

Automatisierung leicht gemacht: Kompakte Roboterschweißzellen ermöglichen KMU den wirtschaftlichen Einstieg ins Roboterschweißen. ‣ weiterlesen

Zusammengefasst besteht der BRSL im Wesentlichen aus drei Hauptkomponenten:

einer datengesteuerten Erreichbarkeitsanalyse für ein Black-Box-Robotermodell
einem Trajektorien-Rollout-Planer, der zukünftige Aktionen und Beobachtungen mithilfe eines Ensembles von online trainierten neuronalen Netzwerken vorhersagt
einer differenzierbaren Polytop-Kollisionsüberprüfung zwischen dem erreichbaren Bereich und Hindernissen, die die Korrektur unsicherer Aktionen ermöglicht

Evaluation anhand von vier Bewegungsplanungsproblemen

Sicheres RL mit einem unbekannten Systemmodell ist somit mit Hilfe eines BRSL möglich. Die Methode wurde anhand von vier Roboter-Bewegungsplanungsproblemen evaluiert, bei denen der BRSL die Sicherheitsbedingungen respektiert und gleichzeitig über den Zeitverlauf eine wesentlich höheren Belohnungsanteil im Vergleich zu herkömmlichen Methoden erzielt. In Simulationen übertrifft BRSL andere sichere RL-Methoden auf einem Turtlebot 3, einem Quadrotor, einer Trajectory-Tracking-Punktmasse und einem Hexarotor im Wind mit einem vorbestimmten unsicheren Bereich, der direkt neben einem highest-reward-Bereich definiert wurde.

Autoren: Prof. Amr Alanwar, Technische Universität München am Campus Heilbronn Weitere Information

8. März 2024

Allgemein, Anwendungen & Lösungen, Künstliche Intelligenz & maschinelles Lernen, Robotik www.robotik-produktion.de 2024

TUM Campus Heilbronn gGmbH

Mehr zum Thema

Potentiale von mobilen Roboterteams in der Produktion
Allgemein
Humanoide oder AMR? Oder beide?
Allgemein
Podiumsdiskussion zum Thema 3D für die autonome…
Mobile Robotik
Der Anfang einer Reise
Automation

Bild: TeDo Verlag GmbH

10 Jahre ROBOTIK UND PRODUKTION

Im April 2016 zur damaligen Hannover Messe ist sie erschienen, die erste Print-Ausgabe von ROBOTIK UND PRODUKTION. Seitdem hat sich das Magazin zur einflussreichen Medienmarke entwickelt.

Weiterlesen: 10 Jahre ROBOTIK UND PRODUKTION
Anzeige

Bild: Beckhoff Automation GmbH & Co. KG

45 % weniger Footprint mit XTS

Mit PC-based Control und XTS reduziert Komax SLE den Maschinen-Footprint um 45 % und steigert Flexibilität in der Kabelverarbeitung.

Weiterlesen: 45 % weniger Footprint mit XTS
Bild: Siemens AG

Realer Einsatz in der Fabrik

Digitale Fäden

Humanoide Roboter galten einst als reine Science Fiction. Im Jahr 2026 werden sie jedoch zur Realität – mithilfe der zunehmenden Verbreitung der digitalen Transformation in verschiedenen Branchen und…

Weiterlesen: Digitale Fäden
Bild: TÜV Rheinland AG

TÜV Rheinland entwickelt neuen Standard für Mähroboter

Langfristig gesunder Rasen

TÜV Rheinland entwickelt neuen Standard zur rasenschonenden Nutzung von Mährobotern. Die Zertifizierung „Lawn Care“ bewertet die schonende Rasenpflege.

Weiterlesen: Langfristig gesunder Rasen
Anzeige

Bild: Carl Cloos Schweißtechnik GmbH

Moderne Einstiegslösungen in die Automatisierung

Automatisierung leicht gemacht: Kompakte Roboterschweißzellen ermöglichen KMU den wirtschaftlichen Einstieg ins Roboterschweißen.

Weiterlesen: Moderne Einstiegslösungen in die Automatisierung

Anzeige

45 % weniger Footprint mit XTS

Mit PC-based Control und XTS reduziert Komax SLE den Maschinen-Footprint um 45 % und steigert…

Weiterlesen: 45 % weniger Footprint mit XTS
Anzeige

Moderne Einstiegslösungen in die Automatisierung

Automatisierung leicht gemacht: Kompakte Roboterschweißzellen ermöglichen KMU den wirtschaftlichen Einstieg ins Roboterschweißen.

Weiterlesen: Moderne Einstiegslösungen in die Automatisierung
Robotik im Gemüseanbau

Von der Fabrik ins Feld

Robotik revolutioniert den Gemüsebau: DAVEGI zeigt, wie ReBeL Cobots von igus die Landwirtschaft effizienter machen.

Weiterlesen: Von der Fabrik ins Feld
Was die industrielle Robotik über humanoide Systeme lehren kann

Dynamische Roboter und funktionale Sicherheit

Humanoide Roboter gelten als der nächste große Sprung in der Automatisierung. Sie verkörpern eine faszinierende…

Weiterlesen: Dynamische Roboter und funktionale Sicherheit
Natalia Ogorelysheva, TU Dortmund, über Diversität und strukturelle Hürden

„Wie wäre es mit einer Realität, in der alle alles sein können?“

Natalia Ogorelysheva promoviert gerade an der TU Dortmund zum Thema Anomalie-Management in Multi-Roboter-Systemen. Zuvor leitete…

Weiterlesen: „Wie wäre es mit einer Realität, in der alle alles sein können?“
Chancen und Unsicherheiten

Robotik in der Weltraumwirtschaft

Die Weltraumwirtschaft wächst exponentiell. Was lange Zeit staatlichen Akteuren vorbehalten war, wird heute zunehmend von…

Weiterlesen: Robotik in der Weltraumwirtschaft
Neuer Sensor für Robotergreifer

Mehr Fingerspitzengefühl

Ein Team von Forschenden rund um Hubert Zangl vom Institut für Intelligente Systemtechnologien hat gemeinsam…

Weiterlesen: Mehr Fingerspitzengefühl

Whitepaper zu humanoiden Robotern

Menschenähnliche Roboter sind im Alltag schon vereinzelt anzutreffen.

Weiterlesen: Whitepaper zu humanoiden Robotern
GMSL-Kamera für AMRs, humanoide und industrielle Roboter

Advantech verstärkt sein Engagement auf dem schnell wachsenden Robotikmarkt durch die Bereitstellung einer nahtlosen, skalierbaren Vision-Integration für autonome mobile Roboter (AMRs), humanoide…

Weiterlesen: GMSL-Kamera für AMRs, humanoide und industrielle Roboter

Robotik als Erfolgsfaktor im E-Commerce

Die Descartes Systems Group hat auf der K5 Future Retail Conference am 23. und 24. Juni im Estrel Berlin gezeigt, wie offene…

Weiterlesen: Robotik als Erfolgsfaktor im E-Commerce
US-Roboterindustrie wächst zweistellig

In den USA ist der Absatz von Industrierobotern im Vergleich zum Vorjahr um 11% gestiegen: 38.000 Einheiten wurden 2025 neu installiert.

Weiterlesen: US-Roboterindustrie wächst zweistellig
Frei verfügbare Online-Datenbank für FTS und AMR

Mit dem Mobile Robot Finder unterstützt Synaos Intralogistikplanerinnen und

Weiterlesen: Frei verfügbare Online-Datenbank für FTS und AMR
Knapp setzt Wachstumskurs fort

Knapp entwickelt sich auch im Geschäftsjahr 2025/26 erfolgreich weiter und bleibt auf Wachstumskurs.

Weiterlesen: Knapp setzt Wachstumskurs fort

Gesteigerter Durchsatz im Schmalganglager

Locus Robotics hat die erfolgreiche Einführung seiner Lösung im Logistikzentrum des Third-Party-Logistikdienstleisters ITG nahe des Münchener Flughafens bekanntgegeben.

Weiterlesen: Gesteigerter Durchsatz im Schmalganglager
Agibot präsentiert sein Roboterportfolio erstmals in Deutschland

Vom Humanoiden bis zum vierbeinigen Roboter

Agibot, ein chinesisches Robotikunternehmen mit Schwerpunkt auf Physical AI, hat in München sein gesamtes Robotikportfolio im Rahmen einer großen Veranstaltung vorgestellt und…

Weiterlesen: Vom Humanoiden bis zum vierbeinigen Roboter
Warum die Offline-Programmierung zum entscheidenden Wettbewerbsfaktor wird

Automatisierung ohne Blindflug

Automatisierung ist für viele produzierende Unternehmen der Schlüssel zur Wettbewerbsfähigkeit. In der Praxis stellen hohe Variantenvielfalt, kurze Produktlebenszyklen und steigender Kostendruck allerdings…

Weiterlesen: Automatisierung ohne Blindflug
Von der AMR-Integration zur intelligenten Orchestrierung

Wer A sagt, muss auch O sagen

AMR versprechen flexible Automatisierung, schnelle Bereitstellung und skalierbare Vorteile gegenüber konventionellen Technologien. In der Praxis aber bringen viele Implementierungen doch nicht den…

Weiterlesen: Wer A sagt, muss auch O sagen
Automatisierte Wursteinlegemaschine bewältigt natürliche Produktvariabilität

Ungenormtes präzise und hygienisch verpacken

Nürnberger Rostbratwürste gehören zur Geschichte der fränkischen Großstadt und sind häufig Bestandteil von Mahlzeiten. Diese Spezialität wird bei der Produktion bislang einzeln…

Weiterlesen: Ungenormtes präzise und hygienisch verpacken
Verbesserte Geschicklichkeit von Robotern mithilfe menschlich generierter Daten

ABB Robotics arbeitet mit dem kalifornischen Bionik-Unternehmen Psyonic daran, Robotertechnik mithilfe realer Daten menschlicher Prothesen weiterzuentwickeln.

Weiterlesen: Verbesserte Geschicklichkeit von Robotern mithilfe menschlich generierter Daten
Produktion humanoider Roboter steigt an – kommerzielle Nutzung bleibt begrenzt

Die Produktion humanoider Roboter verzeichnete 2025 ein deutliches Wachstum.

Weiterlesen: Produktion humanoider Roboter steigt an – kommerzielle Nutzung bleibt begrenzt
Vernetzte kognitive Robotik

Neura Robotics hat auf der Automate 2026 ausgestellt – der größten Automatisierungs- und Robotik-Fachmesse Nordamerikas, die vom 22. bis 25. Juni im…

Weiterlesen: Vernetzte kognitive Robotik