Objekterkennung in Videos mit Deep-Learning

Team: Manuel Hofmann, Christoph Neubauer

Kooperationspartner: OSRAM Continental Austria GmbH

Es sollen Testapplikationen entwickelt werden, welche es ermöglichen, die korrekte Funktion eines Autoscheinwerfersystems des Kooperationspartners zu überprüfen. Eine Java-basierte Applikation soll unter Verwendung der Objekterkennungsbibliothek „OpenCV“ sowie Deep-Learning, spezielle Objekte, wie z.B. Verkehrszeichen in Videos, erkennen. In MATLAB soll die Objekterkennung in Videos mittels im Programm enthaltener Deep-Learning Toolbox realisiert werden.

Die beiden Anwendungen verfügen über eine vergleichbare Funktion, wurden aber auf verschiedene Arten realisiert. In einem Fall wurde MATLAB verwendet, da hier bereits einige Funktionen, in Toolboxen zusammengefasst, zur Verfügung standen. Die andere Applikation wurde mit Java verwirklicht, entsprechende Deep-Learning Bibliotheken stehen erst seit kurzem zur Verfügung. Zuerst wurde in einzelnen Bildern nach Objekten gesucht und anschließend mit Deep-Learning klassifiziert. Danach wurden Graustufenvideos analysiert. Die Anwendungen wurden um ein GUI erweitert, um den Ablauf benutzerfreundlicher zu gestalten.

Als Ergebnis stehen zwei vergleichbare, stabile Applikationen, basierend auf MATLAB und Java, zur Verfügung. Damit ist es möglich, Graustufenvideos zu analysieren und die Zusatzinformationen (Klassifizierung, Koordinaten, Größe, Rotation und Grauwert) jedes Objekts als Text in einer Kopie des Videos auszugeben. Die beiden Anwendungen beinhalten ein GUI, um den Umgang damit zu erleichtern. Osram-Continental plant, die Applikationen in die eigene Tool-Chain einzubinden, und wird die Funktionen weiter ausbauen.