Gestenerkennung mittels Bildverarbeitung

Sebastian Trella ist technik- und robotikbegeistert. Der Lego-Mindstorms-Roboter eines Kollegen, der mit mehreren verschiedenen Sensoren die Gesten einer Hand erkennen kann, brachte ihn auf eine Idee: Der Roboter soll sehen können. Denn bisher musste die jeweilige Geste an einer ganz bestimmten Stelle vor dem Roboter erfolgen, um zuverlässig erkannt zu werden. Mehrere Sensoren waren dafür nötig. Das machte das System unflexibel und dämpfte die Spielfreude.

Robot Vision & Inspection

IDS Case Study Schere Stein Papier 20260121081242

Die Spielrunde verläuft in fünf Phasen: Erfassung der menschlichen Hand durch die Kamera, KI-basierte Bildauswertung, Roboterkommunikation und -bewegung, Ermittlung des Ergebnisses, Roboterkommunikation und -bewegung. – Bilder: ©Sebastian Trella

Auf der Suche nach der geeigneten Kamera stieß Blogger Sebastian Trella auf IDS NXT, ein Komplettsystem für den Einsatz von intelligenter Bildverarbeitung. Die Auswertung der Aufnahmen sowie die Kommunikation der Ergebnisse erfolgen hier direkt auf der bzw. durch die Kamera, ohne zusätzlichen PC. Das IDS NXT Experience Kit brachte außerdem bereits alle Komponenten mit, um sofort und ohne KI-Vorkenntnisse mit der Anwendung starten zu können.

Trella spann den Gedanken weiter und entwickelte einen Roboter, der das Spiel ‚Schere, Stein, Papier‘ spielen sollte: Der (menschliche) Spieler wird aufgefordert, eine der Gesten vor der Kamera auszuführen. Der virtuelle Gegner hat zu diesem Zeitpunkt seine Geste schon zufällig bestimmt. Der Spielzug wird in Echtzeit ausgewertet und der Gewinner angezeigt.

Gestenerkennung mittels Bildverarbeitung

Trella begann mit der Umsetzung der Gestenerkennung mittels Bildverarbeitung. Mithilfe eines cloudbasierten KI-Vision-Studios (IDS Lighthouse) ließ sich das einfach realisieren. Neuronale Netze werden durch Anwendungsbilder mit dem notwendigen Wissen trainiert und in einen passenden Anwendungsablauf verpackt. Das funktioniert mit einer Erkennungsrate von ca. 95 Prozent.

Weiterverarbeitung der ausgewerteten Bilddaten

Die Weiterverarbeitung der erkannten Gesten erfolgt mittels einer eigens erstellten Vision App. Die App bildet die zweite Phase des Projekts und soll das Spielen gegen einen simulierten Computergegner ermöglichen. Sie baut auf der trainierten KI auf und verwendet deren Ergebnisse weiter. Dabei stellt sie den KI-Gegenspieler, der zufällig eine der drei vorgegebenen Handbewegungen ausgibt und vergleicht diese mit der des Spielers. Anschließend entscheidet sie, wer gewonnen hat oder, ob es ein Unentschieden-Ergebnis gibt. Die Vision App ist die Schnittstelle zum Spieler auf dem Computermonitor, die Kamera die Schnittstelle zum Erfassen der Spielergesten. Die Kamera erkennt präzise die Handzeichen, die Entscheidungslogik reagiert regelkonform und der Roboter setzt die entsprechende Bewegung um.

Feinjustierung: Robuste Gestenkennung

Mithilfe der Trainingsplattform, ließ sich das Modell problemlos erweitern. Neue Bilder wurden hinzugefügt, darunter Hände anderer Personen vor verschiedenen Hintergründen und unter wechselnden Lichtverhältnissen. Auch Details wie unterschiedliche Hauttöne oder Ringe flossen in das Training ein. Durch die gezielte Diversifizierung der Trainingsdaten verbesserte sich die Erkennungsleistung: Die KI reagierte nun stabil und zuverlässig, unabhängig davon, wer spielte oder in welcher Umgebung.

Wie spielt der Roboter?

Die Entscheidungen des Roboters sind zufällig. Er blufft nicht und er lernt nicht aus vorherigen Spielen. Doch genau das macht den Charme des Spiels aus: Mensch gegen Maschine, auf Augenhöhe.

Thematik: Lösungen, Allgemein, Anwendungen & Lösungen, Robot Vision & Inspection Ausgabe: ROBOTIK UND PRODUKTION 1 (März) 2026

IDS Imaging Development Systems GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: Cartken GmbH

Wie Indoor-Oudoor-AMRs reale Produktionsprozesse verbessern

Automatisierung jenseits des Idealfalls

Bild: Fraunhofer IPA/Rainer Bez

Modellfabrik und Bin-Packing-Zelle

Bild: Visual Components GmbH

Schnellere Fabrikplanung und Roboterprogrammierung

Bild: HP Inc.

Roboter druckt Baustellen-Layouts

Die HP-Roboterlösung HP SitePrint druckt komplexe Baustellenlayouts mit hoher Genauigkeit.

Weiterlesen: Roboter druckt Baustellen-Layouts
Bild: Synapticon GmbH

Whitepaper zu Advanced Functional Safety für humanoide Roboter

Das Whitepaper ‚Advanced Functional Safety for Humanoid Robots‘ von Synapticon erläutert, warum die gesamte Sicherheitsphilosophie für humanoide Roboter neu überdacht werden muss, und stellt die Positron-Safety-AI-Architektur vor.

Weiterlesen: Whitepaper zu Advanced Functional Safety für humanoide Roboter
Bild: Bosch Rexroth AG

Echtzeitintegration von Cobots in die ctrlX-OS-Umgebung

Kassow Robots hat eine Kassow Robots Connector App für das Betriebssystem ctrlX OS von Bosch Rexroth eingeführt.

Weiterlesen: Echtzeitintegration von Cobots in die ctrlX-OS-Umgebung
Bild: Igus GmbH

Robuste Energieketten mit linearem Rückzugssystem

Das Ingenieurbüro Procon Systems hat für ein Automobilwerk von Seat eine Anlage mit sechsachsigen Kuka-Gelenkarmrobotern konzipiert, die nach dem Lackieren vollautomatisch Unebenheiten ausbessert.

Weiterlesen: Robuste Energieketten mit linearem Rückzugssystem
Bild: Grob-Werke GmbH & Co. KG

Flexibel konfigurierbare Roboterzelle für die Serienfertigung

Grob hat auf seiner Hausmesse erstmals die neue Roboterzelle GRC-M60 vorgestellt und erweitert das Portfolio um eine standardisierte und zugleich flexibel konfigurierbare Roboterzelle für die Serienfertigung.

Weiterlesen: Flexibel konfigurierbare Roboterzelle für die Serienfertigung

Statement von Dell Technologies

Diese Anforderungen müssen IT-Systeme in der Robotik künftig erfüllen

KI macht Roboter so intelligent, dass sie ihre Umgebung wahrnehmen, komplexe Aufgaben eigenständig erledigen und…

Weiterlesen: Diese Anforderungen müssen IT-Systeme in der Robotik künftig erfüllen
Software-Plattform für Physical AI

Kuka hat auf der NVIDIA GTC 2026 vom 16. bis 19. März in San Jose…

Weiterlesen: Software-Plattform für Physical AI

Sicheres, ergonomisches Wireless-HMI-Panel

Am Produktionsstandort Pelhimov von Wöhler werden Maschinen für die Bürstenfertigung entwickelt und hergestellt.

Weiterlesen: Sicheres, ergonomisches Wireless-HMI-Panel
Roboterlösungen für die Gastronomie

Die Allianz von Pi4_Robotics, Robozän Deutschland, Transgourmet, Menoovo und GoodBytz präsentiert auf der Internorga Lösungen, die kollaborative Robotik in den Alltag von…

Weiterlesen: Roboterlösungen für die Gastronomie

Sporthandelskette investiert in automatisiertes Lager

Stadium, eine Sporthandelskette in Skandinavien, baut in Norrköping ein neues, automatisiertes Distributionszentrum mit dem Skypod-System von Exotec auf.

Weiterlesen: Sporthandelskette investiert in automatisiertes Lager
Women in Robotics 2026 – IFR stellt Preisträgerinnen vor

Um Frauen in der Robotikbranche mehr Sichtbarkeit und Anerkennung zu verschaffen, hat die International Federation of Robotics elf Frauen im Jahr 2026…

Weiterlesen: Women in Robotics 2026 – IFR stellt Preisträgerinnen vor
ROS2 als Middleware zwischen Automatisierungsplattform und Applikationssoftware

Der Schlüssel für offene Systeme

Die industrielle Robotik befindet sich an einem Wendepunkt. Die wachsende Variantenvielfalt, immer kürzere Projektlaufzeiten und der stetig steigende Anteil an Software stellen…

Weiterlesen: Der Schlüssel für offene Systeme
Kostenfreie Ticktes für die Optatec 2026

Vom 5. bis 7. Mai treffen sich die Experten, die sich mit der Erforschung des Lichts befassen, in Frankfurt/Main zur Optatec, der…

Weiterlesen: Kostenfreie Ticktes für die Optatec 2026

5D-Kamera mit okklusionsfreier 3D-Bildaufnahme für Robot Vision

Die meisten Industriekameras nehmen nur 2D-Bilder auf, doch viele Anwendungen erfordern zunehmend Tiefenwahrnehmung bei kurzen und sehr kurzen Entfernungen.

Weiterlesen: 5D-Kamera mit okklusionsfreier 3D-Bildaufnahme für Robot Vision
All About Automation in Friedrichshafen deutlich gewachsen

Persönliche Gespräche, kurze Wege, konkrete Lösungen und eine gute Messeatmosphäre prägten die All About Automation in Friedrichshafen am 10. und 11. März.

Weiterlesen: All About Automation in Friedrichshafen deutlich gewachsen
Brückenschlag zwischen AGVs und AMRs

BlueBotics stellt auf der diesjährigen Logimat eine Erweiterung der ANT-Software vor, die es mobilen Robotern erlaubt, Hindernisse automatisch zu umfahren, ohne Deadlocks…

Weiterlesen: Brückenschlag zwischen AGVs und AMRs
Smarte Antriebstechnik und digitalisierte Getriebe

Wittenstein präsentiert auf den diesjährigen vier All-About-Automation-Messen mechatronische und cybertronische Antriebslösungen für Industrieautomatik und Robotik.

Weiterlesen: Smarte Antriebstechnik und digitalisierte Getriebe
3D-Ultraschallsensorik für mobile Roboter

Sonair zeigt in diesem Jahr erstmals auf der Logimat seine 3D-Ultraschallsensorik, die Menschen und Objekte auch in komplexen und dynamischen Umgebungen in…

Weiterlesen: 3D-Ultraschallsensorik für mobile Roboter
Trainingslager für KI, Robotik und Circular Economy

Das Smart Green Island Innovationsfestival hat mit 834 Teilnehmenden Innovationsentwicklung, Wissenschaftsdialog und Nachwuchsförderung in einem gemeinsamen Format verbunden – von Schulworkshops über…

Weiterlesen: Trainingslager für KI, Robotik und Circular Economy
Teradyne Robotics ergreift rechtliche Schritte

Teradyne Robotics, eine Tochtergesellschaft von Teradyne, hat bekannt gegeben, dass das Unternehmen in Deutschland rechtliche Schritte gegen die deutsche Tochtergesellschaft des chinesischen…

Weiterlesen: Teradyne Robotics ergreift rechtliche Schritte
Humanoider Roboterkopf mit 360°-Multisensorik-Fähigkeiten

Er sieht alles

Humanoide Roboterköpfe sind ein wichtiger Schritt in der Entwicklung wahrnehmungsfähiger und reaktionsschneller Maschinen. Sie ermöglichen es mittels moderner Sensortechnik, die Welt durch…

Weiterlesen: Er sieht alles