Deep Learning-Based Video Coding for Machines

Beschreibung

Bild- und Videodaten werden zunehmend nicht nur von einem menschlichen Betrachter ausgewertet, sondern mittels Algorithmen maschinell ausgewertet. In vielen Szenarien, wie z.B. Smart City Systemen, ist die Rechenleistung am Aufnahmegerät zu gering, um die Auswertung lokal durchzuführen. Die Bilddaten werden stattdessen an Geräte mit ausreichender Rechenleistung übertragen. Da die Bandbreite limitiert ist, müssen verlustbehaftete Kompressionsverfahren angewandt werden. Bereits existierende Videokompressionstechniken sind jedoch auf die visuelle Qualität der Rekonstruktion und nicht auf eine optimale Auswertung mit Algorithmen optimiert. Im Rahmen von „Video Coding for Machines“ (VCM) werden verschiedene Methoden für diesen Anwendungsfall untersucht.

Details können dem folgenden Dokument entnommen werden:
Themen_Vorschläge

Voraussetzungen

Vorausgesetzt werden Erfahrungen in der Programmierung mit Python, Deep Learning (PyTorch/TF) und Bild- und Videokompression


Hochschullehrer

Prof. Dr.-Ing. André Kaup
andre.kaup@fau.de
Raum 06.031