)
KI und Computer Vision für Sicherheit und Qualitätskontrolle
Intelligente Systeme zur Unterstützung menschlicher Kontrolle
Durch Echtzeit-Computer Vision entstehen greifbare Verbesserungen in industriellen und sicherheitsrelevanten Umgebungen: Maschinen lernen, visuelle Daten aus Bildern und Videos zu interpretieren und Ereignisse im Moment ihres Geschehens zu analysieren.
Das Grundprinzip der Echtzeitverarbeitung
„Im Kern zeichnet sich Echtzeit-Computer Vision durch die Fähigkeit eines Systems aus, visuelle Daten zu verarbeiten und nahezu sofort Ergebnisse bereitzustellen. Diese Fähigkeit ist entscheidend für Lösungen, die aktiv in dynamische Prozesse eingreifen und sie verbessern – sei es zur Erhöhung der Sicherheit oder zur Steuerung von Produktionslinien. Dafür braucht es nicht nur ausgefeilte Algorithmen, sondern auch einen Hardware- und Software-Stack, der konsequent auf Leistung optimiert ist
Hochgeschwindigkeitsinferenz mit NVIDIA TensorRT
Ein zentraler Bestandteil des Software-Stacks ist NVIDIA TensorRT, eine speziell entwickelte Bibliothek zur Beschleunigung der Inferenzgeschwindigkeit von KI-Modellen. Eine ihrer wichtigsten Techniken ist die Präzisionsreduktion: Berechnungen im neuronalen Netzwerk werden mit Zahlen geringerer Genauigkeit durchgeführt, was die Verarbeitung erheblich beschleunigt. Gleichzeitig wird dieser Schritt so gesteuert, dass die Genauigkeit der Ergebnisse weitgehend erhalten bleibt. TensorRT ist zudem mit gängigen Deep-Learning-Frameworks wie PyTorch kompatibel, das in diesen Lösungen eingesetzt wird, und spielt eine entscheidende Rolle bei der optimalen Auslastung der zugrunde liegenden GPU-Hardware.
Edge-Lösungen mit Leistung und Privatsphäre
Die Hardwarebasis für diese Echtzeitanwendungen bildet das NVIDIA Jetson AGX Orin – ein leistungsstarkes, kompaktes Edge-Gerät, speziell für anspruchsvolle KI-Anwendungen entwickelt. Die Datenverarbeitung „am Edge“, also direkt auf dem Gerät statt auf einem entfernten Server, bietet mehrere entscheidende Vorteile: Sie reduziert die Latenz, da Daten nicht über das Netzwerk übertragen werden müssen, spart Bandbreite und erhöht gleichzeitig Privatsphäre und Sicherheit, da sensible visuelle Daten lokal bleiben.
Herausforderungen der Flughafensicherheit
Sicherheit an Flughäfen hat höchste Priorität und erfordert zahlreiche Kontrollen sowie ein umfangreiches Personal, um täglich Tausende von Passagieren zu schützen. Technologische Innovationen spielen dabei eine zentrale Rolle, indem sie diese strengen Verfahren unterstützen und verbessern. Die permanente Aufrechterhaltung ununterbrochener Wachsamkeit stellt für menschliches Personal jedoch eine erhebliche Herausforderung dar. Hier kann künstliche Intelligenz effektiv helfen, indem sie menschliche Fähigkeiten ergänzt – etwa bei der Kontrolle von Bordkarten. Computer-Vision-Technologien sind besonders entscheidend, um Sicherheitslücken zu erkennen, beispielsweise beim Verfolgen von Personen oder bei Perimeterverletzungen.
Bekämpfung von zu dichtem Auffahren
Tailgating tritt auf, wenn eine unbefugte Person einem berechtigten Passagier dicht hinterher durch ein Tor folgt, bevor dieses schließt, und so die Identitätskontrolle umgeht. Zur Bekämpfung dieses Problems wurde ein Echtzeit-Computer-Vision-System entwickelt, das Personen kontinuierlich verfolgt, während sie sich den E-Gates nähern und diese passieren. Durch die Kombination von Bewegungsverfolgung, Torstatusdaten und zeitlicher Analyse kann das System genau bestimmen, ob jeder Zutritt berechtigt ist. Für die Personenerkennung wird das Open-Source-Modell RTMDet eingesetzt, während ein Tracking-Modul Personen über Videobilder hinweg eindeutige Identifikatoren zuweist, sodass eine kontinuierliche Bewegungsanalyse möglich ist. Werden während eines Torzyklus oder innerhalb eines unplausibel kurzen Zeitintervalls zwei Personen erkannt, stuft das System dies als Tailgating-Vorfall ein und löst sofort einen akustischen Alarm sowie eine Benachrichtigung über die Benutzeroberfläche für das Sicherheitspersonal aus.
Ein weiterer kritischer Anwendungsfall betrifft Personen, die versuchen, über die Absperrung der Warteschlange zu klettern, um das Scannen der Bordkarte zu umgehen. Dies erfordert ein detailliertes Verständnis der menschlichen Körperhaltung und Bewegung, das mit dem RTMPose-Modell erreicht wird. Zunächst erkennt das System die Personen und analysiert anschließend 17 zentrale Körperpunkte – mit besonderem Fokus auf die Hüften – um festzustellen, ob jemand über die Absperrung klettert. Abhängig von der Nähe einer Person zur Absperrung aktiviert das System die Posenschätzung in Echtzeit und bewertet deren Bewegung. Wird ein Kletterverhalten erkannt, löst das System einen Alarm aus, um das Sicherheitspersonal sofort zu informieren.
Durch die Kombination von Personenerkennung, -verfolgung und Posenschätzung in einer einheitlichen Computer-Vision-Pipeline verbessert das System die Situationswahrnehmung erheblich und unterstützt die menschliche Überwachung bei der Erkennung von Verstößen, die allein durch manuelle Kontrolle nur schwer zu erkennen wären.
Die Bedeutung niedriger falsch-positiver Ergebnisse
Ein entscheidender Maßstab für den Erfolg eines automatisierten Sicherheitssystems an einem stark frequentierten Flughafen ist die Fehlalarmrate. Täglich passieren Tausende Passagiere, häufig mit Gepäck oder in Interaktion miteinander, die überwachten Bereiche, wodurch komplexe Szenen entstehen, die potenziell Fehlalarme auslösen könnten. Eine hohe Zahl an Fehlalarmen würde das Sicherheitspersonal eher ablenken als unterstützen und das System unbrauchbar machen. Die entwickelten Computer-Vision-Systeme erreichen eine Fehlalarmrate von unter 0,2 %, was eine deutliche Verbesserung gegenüber früheren sensorgestützten Tracking-Systemen darstellt, die Fehlalarmraten von über 5 % aufwiesen – das entspricht mehr als 600 Fehlalarmen pro Tag.
Nutzung von KI und 3D-Punktwolken für die industrielle Qualitätskontrolle
In industriellen Umgebungen, in denen Präzision entscheidend ist, wird KI zunehmend für die Qualitätskontrolle eingesetzt. Sie ermöglicht eine konsistente Echtzeitüberwachung und überwindet die Einschränkungen menschlicher Inspektionen, wie Müdigkeit oder subjektive Beurteilungen. Während traditionelle 2D-Bilder Oberflächendefekte erkennen können, erfordern manche Anwendungen ein detailliertes Verständnis der Form und Struktur eines Objekts. Hier kommen Punktwolken zum Einsatz – hochauflösende 3D-Darstellungen aus Tausenden räumlicher Datenpunkte. Die Verarbeitung solcher dichter Daten in Echtzeit ist jedoch anspruchsvoll: Standardisierte Komprimierungsmethoden für Tiefeninformationen fehlen, und die rechnerischen Anforderungen sind hoch. Effiziente Techniken wie das Zuschneiden relevanter Bereiche oder das Herunterrechnen zur Reduzierung der Datengröße sind daher entscheidend, um eine präzise und praktikable Echtzeit-3D-Inspektion zu gewährleisten.
KI-gestützte 3D-Inspektion zur Überwachung der Palettenmontage
Dieses System nutzt fortschrittliche KI und 3D-Bildgebung, um einen Roboterarm bei der Palettenmontage durch Schichten von Kisten zu überwachen. Eine Time-of-Flight (ToF) 3D-Kamera, die RGB- und Tiefenströme kombiniert, erzeugt präzise Punktwolken, mit denen jede abgeschlossene Schicht auf Qualität und Genauigkeit inspiziert wird. Zwei zentrale Leistungsindikatoren (KPIs) werden bewertet: die Füllrate der Palettenschicht und ihre Ausrichtung. Dank der hohen Präzision der Kamera lassen sich Fehlanpassungen von nur zwei Zentimetern aus einer Entfernung von sechs Metern erkennen.
Die Inspektionspipeline beginnt mit der Erfassung statischer Szenen, nachdem der Roboterarm seine Bewegung abgeschlossen hat. Anschließend wird die Orientierung der Punktwolke in das Weltkoordinatensystem transformiert, und optimale Frames werden anhand der Dichteanalyse ausgewählt – alles unter Einsatz von Multiprocessing für Echtzeitbetrieb.
Nach der Frame-Auswahl wird die Punktwolke gereinigt und optimiert: Rauschen, etwa durch metallische Reflexionen verursacht, wird mittels Clusteralgorithmen entfernt, wobei der Fokus auf der größten verbundenen Komponente liegt. Leere Paletten werden verarbeitet, um Basis-KPIs festzulegen, während das schnelle MobileSAM-Modell zur Segmentierung der Palette eingesetzt wird. Zusätzliche Datenreduktion erfolgt durch Zuschneiden und Herunterverkleinern der Punktwolken.
Ein hybrider 2D/3D-Ansatz ermöglicht anschließend die präzise Schätzung der Konturen jeder Palettenschicht. Abschließend werden die KPIs berechnet, indem die polygonale Fläche der Schicht mit der leeren Palette verglichen und auf Ausrichtungsanomalien überprüft wird, wenn Punkte außerhalb definierter Grenzen liegen – so wird eine hochwertige Palettenmontage sichergestellt.
Messbare Ergebnisse aufzeigen
Die Effektivität dieses Systems in industriellen Anwendungen zeigt sich deutlich in seinen Ergebnissen. Während eines dreiwöchigen Testzeitraums erkannte das System mehr Mängel als die durchschnittliche jährliche Anzahl von Kundenbeschwerden über fehlerhafte Paletten, was darauf hinweist, dass zuvor viele Fehler unbemerkt blieben. Die Leistungskennzahlen waren herausragend: Anomalien traten in nur 0,009 % der analysierten Schichten auf, während die Rate an falsch positiven Ergebnissen mit 0,001 % extrem niedrig war.

Technology Reply ist das Unternehmen der Reply Group, das sich auf die Gestaltung und Schaffung innovativer Lösungen auf Basis von Oracle-Technologien spezialisiert hat. Mit tiefgreifender Expertise und Erfahrung, die über mehr als 25 Jahre Tätigkeit gewonnen wurde, unterstützt Technology Reply seine Kunden in Innovations- und digitalen Transformationsprozessen mit einem Team von Fachleuten, die in allen Phasen des Projektlebenszyklus eingreifen können: Analyse, Design, Implementierung, Einführung und Betrieb. Technology Reply positioniert sich als Referenzpartner für Oracle On-Premise- und Cloud-Technologien: BigData, Analytics, eCommerce, Mobile, Identity and Access Management und Content Management. Mit seiner agilen Kultur wird Technology Reply zu einem führenden Unternehmen in aufkommenden Technologien und implementiert Künstliche Intelligenz, maschinelles Lernen, auf DevOps basierende Microservices und kognitive Technologien aus einer Vielzahl von Gründen, Sektoren und Kunden.