Intelligente Bild- und Videoanalyse
In der Bildverarbeitung werden in den letzten Jahren vermehrt Machine Learning Ansätze angewendet. Deep Convolutional Neural Networks (tiefe CNN) eignen sich mit am besten für die Klassifizierung und Erkennung von Bildinhalten. Zu den großen Durchbrüchen gehörten zu Beginn die zuverlässige Erkennung von handgeschriebenen Postleitzahlen und später die Erkennung von Gesichtern oder Kfz-Kennzeichen.
Aktuell werden mächtige und echtzeitfähige Netzwerke verwendet, die multiple Klassen in Bildern erkennen können, um beispielsweise in Echtzeit Personen, Fahrzeuge, Hindernisse und Verkehrsschilder, sowie deren Positionen zu erkennen. Ein CNN wird nach der Erkennungsrate beurteilt. Idealerweise erhöhen Erweiterungen die Geschwindigkeit und Genauigkeit, die benötigt werden, um den Bildinhalt richtig zu bestimmen.
Des Weiteren ist in den letzten Jahren das Thema Umwelt- und Klimaschutz immer stärker in den Fokus der Politik und der Bevölkerung gerutscht. So kann beispielsweise mit Waldbrand-Früherkennungssystemen die Zeitspanne bis zur Entdeckung drastisch reduziert werden und die Gefahr für Bewohner frühzeitig bekannt gegeben werden. Auch in der Nahrungsmittelindustrie werden KI-Systeme eingesetzt, um verdorbene von noch genießbaren Lebensmitteln zu unterscheiden, mit dem Ziel, dass weniger im Müll landet. Im Bereich Recycling kann diese neue Technologie ebenfalls eingesetzt werden, um Kunststoffe zuverlässig und effizient zu erkennen und somit eine Wiederverwendung zu ermöglichen.
Künstliche Intelligenz im Bereich Recycling
Contact |
Katja Kossira, M.Sc. |
E-Mail: katja.kossira@fau.de |
Link to person |
PD Dr.-Ing. habil. Jürgen Seiler |
E-Mail: juergen.seiler@fau.de |
Link zur Person |
Einsatz von Methoden der der intelligenten Bild- und Videoanalyse im Bereich Recycling
Die steigende Relevanz des Themas Umwelt- und Klimaschutz wirkt sich auf viele Bereiche unseres Lebens aus: Strände im Urlaub sind übersät mit Einweg- Plastikflaschen und im Ozean treibt ein riesiger Müllstrudel. Die Temperaturen steigen, trotzdem findet man im Supermarkt kaum etwas, das nicht in Kunststoff verpackt ist. Diese Mengen an Müll werden aktuell zu 67 % thermisch verwertet, d.h. verbrannt, der Wirkungsgrad dabei beträgt allerdings lediglich 30 %, zusätzlich wird dabei viel CO2 ausgestoßen (Quelle: Plastikatlas 20191). Da beim Recycling der Wirkungsgrad mit 85 % deutlich höher liegt und zusätzlich weniger CO2 ausgestoßen wird, ist es wichtig, effiziente und günstige Methoden zu schaffen, Kunststoffe einwandfrei zu klassifizieren, um sie dem Wiederverwendungsprozess zuzuführen.
Zur Unterstützung dieser Entwicklung soll ein neuer Ansatz erforscht werden, der mittels intelligenter Bild- und Videoanalyse unter Zuhilfenahme von KI entscheidet, welcher Kunststoffart die Probe angehört. Grundlage hierfür war die Feststellung, dass die Kohlenstoffketten der Kunststoffe das Licht bei unterschiedlichen Wellenlängen im infraroten Bereich unterschiedlich stark reflektieren, wodurch sich verschiedene Farben für charakteristische Wellenlängen ergeben. Dies ist beispielhaft in der folgenden Abbildung dargestellt (links: originale Darstellung, rechts: Überlagerung von Bilder aufgenommen mit Filtern der Wellenlängen 850nm, 1000nm und 1150nm).
Um künftig die Kunststoffe automatisiert zu erkennen, wird das multispektrale Kamera Array zur Bildgebung (CAMSI) weiterentwickelt und den Bedürfnissen angepasst. Die spektralen Fingerabdrücke der verschiedenen Kunststoffklassen werden ermittelt und im Anschluss zum Trainieren eines Modells verwendet. Außerdem wird eine Entscheidungsmatrix erstellt, die aufgrund von signifikanten Peaks der Spektren die optimale Filterwahl bestimmt. Hiermit erfolgt dann eine eindeutige Klassifikation und der Wertstoff kann dem Recyclingprozess zugeführt werden. Eingesetzt werden soll die neue Methode beispielsweise in Pfandautomaten oder an Sortieranlagen von Wertstoffhöfen.
1 https://www.bund.net/fileadmin/user_upload_bund/publikationen/chemie/chemie_plastikatlas_2019.pdf
Eingebettete Wahrnehmung für autonome Fahrzeuge
Eingebettete Wahrnehmung für autonome Fahrzeuge
Contact |
Maximiliane Gruber, M. Sc. |
E-Mail: maximiliane.gruber@fau.de |
Link zur Person |
Kamal Nambiar, M. Sc. |
E-Mail: kamal.nambiar@fau.de |
Link zur Person |
PD Dr.-Ing. habil. Jürgen Seiler |
E-Mail: juergen.seiler@fau.de |
Link zur Person |
Das Hauptziel der eingebetteten Wahrnehmung ist die Entwicklung eines datengestriebenen Frameworks, das die Objekterkennung in Straßendaten ermöglicht und so den Fortschritt im autonomen Fahren vorantreibt. Das Hardwaresystem umfasst mehrere Kameras und LiDAR-Sensoren, während das Softwaresystem sowohl aus einer Offline- als auch einer Online-Wahrnehmungskomponente besteht. Die Online-Komponente ist darauf ausgelegt, präzise Ergebnisse in Echtzeit zu liefern und gleichzeitig die begrenzten Rechenressourcen während der Fahrt effektiv zu nutzen. Die Offline-Komponente hingegen arbeitet unabhängig von denselben Daten, sobald die Aufzeichnungen abgeschlossen sind. Es profitiert von umfangreicheren Rechenressourcen und ermöglicht die Ausführung hochkomplexer Algorithmen. Dadurch werden zuverlässigere Ergebnisse erwartet. Mit einem solchen System können große Referenzdatensätze über verschiedene Verkehrs- und Wetterbedingungen generiert werden.
Die Entwicklung des Frameworks zur eingebetteten Wahrnehmung umfasst verschiedene Herausforderungen im Bereich der Signalverarbeitung, darunter unter anderem die Kalibrierung von Sensoren, Datenkomprimierung, Analyse und Fusion multimodaler Daten, Datenaugmentierung und die Entwicklung von Wahrnehmungsalgorithmen. Die Schwerpunkte unserer Forschung lassen sich grob in folgende Bereiche gliedern:
- Selbstkalibrierung der LiDAR-Kamera Um den Anforderungen durch die vielfältigen Betriebsbedingungen gerecht zu werden und heuristische Algorithmen zu vermeiden, schlagen wir eine auf tiefem Lernen basierende Methode zur Selbstkalibrierung vor. Ziel dieser Methode ist es, gleichzeitig eine intrinsische Kalibrierung des Kamerasensors und eine extrinsische Kalibrierung der LiDAR-Kamerakonfiguration durchzuführen.
- LiDAR-Punktwolkencodierung Effiziente Codierungsalgorithmen sind entscheidend für die Verarbeitung der großen Datenmengen, die mit LiDAR-Sensoren aufgenommen werden und gespeichert oder übertragen werden sollen. Kleinere Dateigrößen reduzieren nicht nur die Arbeitsspeicher- und Datenspeicherkosten, sondern ermöglichen auch einen schnelleren Informationsaustausch, wodurch die Gesamtlatenz des Wahrnehmungssystems verringert wird. Da diese Signale hauptsächlich nachgelagerten Wahrnehmungsaufgaben wie der Objekterkennung dienen, geht unsere Forschung über traditionelle Qualitätsmetriken wie PSNR hinaus. Wir entwickeln Codierungsalgorithmen, die auch den Einfluss der LiDAR-Punktwolkencodierung auf die Erkennungsgenauigkeit in modernen Wahrnehmungsalgorithmen berücksichtigen.
Abb. 1: Demonstratoraufbau bestehend aus Stereokamera und LiDAR-Sensor.
|
Abb. 2: Leistungsverbesserung durch unsere Methoden zum Lernen von Bildstörungen bei Bildern, die durch JPEG2000-Kodierung verzerrt wurden.
|
- Lernen von Bildstörungen zur Domänenadaption Da datengetriebene Methoden eine bestimmte Aufgabe aus annotierten Datenproben erlernen, hängen solche Methoden stark von der Qualität der Trainingsdaten ab. Das heißt die Trainingsdaten müssen den Daten, die während der Anwendung und des Tests auftreten, ausreichend ähneln. In der Praxis können unbekannte Verzerrungen jedoch zu einer Diskrepanz zwischen Trainings- und Testdaten führen (engl. domain gap), was die Leistung eines Bildverarbeitungssystems beeinträchtigt. Beispiele für solche unbekannten Verzerrungen, die in Bilddaten auftreten, sind Unschärfe, Rauschen und Codierung. Diese Verzerrungen unterscheiden sich beispielsweise für verschiedene Kamerasysteme. In Abb. 2a wird beispielhaft der Leistungsabfall für JPEG2000-codierte Testdaten veranschaulicht, wenn die Trainingsdaten keine derartigen Verzerrungen enthielten. Um dem Leistungsabfall von Bildverarbeitungssystemen in solchen Fällen zu begegnen, erforschen wir Methoden zum Lernen der oben genannten unbekannten Bildverzerrungen. Die erlernten Bildverzerrungen werden dann auf sauberen Daten emuliert, die als zusätzliche Trainingsdaten zur Verbesserung der Leistung von Bildverarbeitungssystemen dienen. In unseren Arbeiten betrachten wir maschinelle Bildverarbeitungssysteme als Black Box und entwickeln allgemeine Methoden, die für verschiedene Aufgaben eingesetzt werden können. Dieser Ansatz wird auch als Domänenanpassung auf Pixelebene (engl. pixel-level domain adaptation) bezeichnet. In Abb. 2b ist die Verbesserung der Objekterkennung, bei der Verwendung unserer Methode dargestellt.
- Fahrspurerkennung Die Fahrspurerkennung ist eine entscheidende Komponente für die sichere Navigation autonomer Fahrzeuge. Unsere Forschung konzentriert sich auf die Entwicklung eines auf einem neuronalen Netzwerk basierenden Modells, das fusionierte Merkmale von LiDAR und monokularen Kamerasignalen nutzt, um ein 3D-Profil der Straße zu erstellen. Die Spurerkennungsfunktionen unseres Modells sind robust gegenüber Straßengefälle und ermöglichen eine präzise Tiefenschätzung.
- Objekterkennung und Objektverfolgung Zur Objekterkennung gehört die Identifizierung und Lokalisierung von Verkehrsteilnehmern und Verkehrszeichen innerhalb eines von den Fahrzeugsensoren erfassten Rahmens. Die Objektverfolgung verbessert die Wahrnehmung durch die Verknüpfung identischer Objekte über mehrere Frames hinweg und ermöglicht die Bewegungsschätzung für dynamische Einheiten wie Fußgänger und Fahrzeuge. Bei der 3D-Mehrobjektverfolgungsaufgabe werden üblicherweise zwei Ansätze verwendet. Der erste Ansatz verwendet ein durchgängig trainierbares Objektverfolgungssystem für eine Bildsequenz. Der zweite Ansatz besteht darin, für jedes Bild einzeln einen 3D-Objektdetektor zu verwenden und anschließend mithilfe eines Kalman-Filters und des ungarischen Algorithmus eine Zuordnung vorzunehmen. Unsere Forschung untersucht beide Ansätze und optimiert sie weiter, um den Herausforderungen in Bezug auf Geschwindigkeit und Genauigkeit in unseren Online- und Offline-Verarbeitungspipelines gerecht zu werden.
Künstliche Intelligenz für die Qualitätssicherung
Contact |
Andreas Spruck, M.Sc. |
E-Mail: andreas.spruck@fau.de |
Link to person |
PD Dr.-Ing. habil. Jürgen Seiler |
E-Mail: juergen.seiler@fau.de |
Link zur Person |
Einsatz von Methoden der Künstlichen Intelligenz für die Qualitätssicherung in der Produktionstechnik
Der steigende Grad der Automatisierung wirkt sich auf alle Bereiche unseres Lebens aus. Ein Themenfeld, das diesem Wandel jedoch besonders unterliegt, ist die maschinelle Produktion. Moderne Fertigungsstraßen arbeiten bereits jetzt weitgehend ohne menschliche Eingriffe, durch die bevorstehenden Änderung im Rahmen von Industrie 4.0 wird dieses Phänomen jedoch noch deutlich ausgeprägter werden. Um die Qualität der so produzierten Werkstücke garantieren zu können, ist es notwendig eine abschließende Sichtkontrolle durchzuführen. Aktuell wird diese in vielen Bereichen immer noch manuell durchgeführt, da es sich dabei jedoch um eine monotone und anstrengende Arbeit handelt, wird auch hierfür nach einer automatisierten Lösung gesucht.
Es existieren bereits seit einigen Jahren solch automatische optische Prüfsysteme, diese bedienen sich bisher jedoch klassischen Bildverarbeitungsmethoden, die es erforderlich machen vor Beginn der Prüfung die jeweiligen Toleranzbereiche und Prüfkriterien für das aktuelle Werkstück festzulegen. Gerade im Kontext von Industrie 4.0 mit häufig wechselnden Prüfaufgaben und Kleinserien ist dieses Vorgehen zunehmend ineffizient. Alternativ hierzu soll ein neuer Ansatz entwickelt werden, der mittels maschinellen Lernens entscheidet, welche Werkstücke in Ordnung sind, und welche Werkstücke fehlerhaft sind. Das typische Vorgehen zur Lösung dieses Problems wäre, eine Vielzahl an Aufnahmen von einwandfreien und beschädigten Werkstücken zu nutzen und diese Aufnahmen dann zum Training eines neuronalen Netzes zu verwenden. Hierbei besteht jedoch das große Problem, dass eine entsprechend große Anzahl an Werkstücken erst einmal erstellt werden muss. Weiterhin müssen genügend fehlerhafte Werkstücke enthalten sein, um ein verlässliches Training zu gewährleisten.
Gerade in Hinblick auf eine schnelle Anpassbarkeit der Produktion und der individuellen Herstellung von Werkstücken ist dieses Vorgehen nicht geeignet. Um die Herstellung von Werkstücken und anschließende Begutachtung zur Erstellung von Trainingsdaten für das neuronale Netz zu vermeiden, wird hier ein neuer Ansatz verfolgt. Hierbei werden die Trainingsdaten nicht mit einer Kamera aufgenommen, sondern simuliert. Das bedeutet, ausgehend von einem Modell des zu produzierenden Werkstücks werden die Bilder simuliert, die später in der Produktion während der Qualitätsprüfung aufgenommen werden. Das damit trainierte neuronale Netz wird anschließend auf tatsächlichen Aufnahmen der zu prüfenden Werkstücke angewendet. Hiermit erfolgt dann eine Klassifikation nach fehlerfreien und fehlerhaften Werkstücken.
Publikationen
2022
Domain Adaptation for Unknown Image Distortions in Instance Segmentation
IEEE International Conference on Image Processing (ICIP) (Bordeaux, 16. Oktober 2022 - 19. Oktober 2022)
DOI: 10.1109/ICIP46576.2022.9897339
URL: https://arxiv.org/abs/2210.02386
BibTeX: Download
, , , , :
Increasing the Accuracy of a Neural Network Using Frequency Selective Mesh-to-Grid Resampling
IEEE International Symposium on Circuits and Systems (ISCAS) (, 28. Mai 2022 - 1. Juni 2022)
DOI: 10.1109/iscas48785.2022.9937735
URL: https://arxiv.org/abs/2209.14431
BibTeX: Download
, , :
2021
Component-Wise Power Estimation of Electrical Devices Using Thermal Imaging
In: IEEE Transactions on Consumer Electronics 67 (2021), S. 383-392
ISSN: 0098-3063
DOI: 10.1109/TCE.2021.3122076
URL: http://arxiv.org/abs/2307.08354
BibTeX: Download
, , , :
3D Rendering Framework for Data Augmentation in Optical Character Recognition
2021 International Symposium on Signals, Circuits and Systems (ISSCS) (Iasi, Romania (virtual), 15. Juli 2021 - 16. Juli 2021)
In: ISSCS 2021 - International Symposium on Signals, Circuits and Systems 2021
DOI: 10.1109/ISSCS52333.2021.9497438
URL: https://arxiv.org/abs/2209.14970
BibTeX: Download
, , , , , :
2020
Quality Assurance of Weld Seams Using Laser Triangulation Imaging and Deep Neural Networks
IEEE International Workshop on Metrology for Industry 4.0 and IoT (Rome (Virtual Conference), Italy, 3. Juni 2020 - 5. Juni 2020)
In: 2020 IEEE International Workshop on Metrology for Industry 4.0 & IoT 2020
DOI: 10.1109/MetroInd4.0IoT48571.2020.9138205
BibTeX: Download
, , , , , :
2019
Deep Counting Model Extensions with Segmentation for Person Detection
44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019 (Brighton, 12. Mai 2019 - 17. Mai 2019)
In: ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings 2019
DOI: 10.1109/ICASSP.2019.8682662
BibTeX: Download
, , , :
Deep Network Pruning for Object Detection
26th IEEE International Conference on Image Processing, ICIP 2019 (Taipei, 22. September 2019 - 25. September 2019)
In: Proceedings - International Conference on Image Processing, ICIP 2019
DOI: 10.1109/ICIP.2019.8803505
BibTeX: Download
, , , , :
Irregular Motion Detection in Automotive Navigation Systems with Soft Map Rotation
Proceedings of the 37th IEEE International Conference On Consumer Electronics ICCE (Las Vegas, NV, 11. Januar 2019 - 13. Januar 2019)
In: Proceedings of the 37th IEEE International Conference On Consumer Electronics ICCE 2019
DOI: 10.1109/icce.2019.8661963
BibTeX: Download
, , , , :
2018
Robustness of Deep Convolutional Neural Networks for Image Degradations
IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (Calgary, Canada, 15. April 2018 - 20. April 2018)
DOI: 10.1109/icassp.2018.8461907
BibTeX: Download
, , , , :
2017
Reliable Pedestrian Detection Using A Deep Neural Network Trained On Pedestrian Counts
IEEE International Conference on Image Processing (ICIP) (Beijing, 17. September 2017 - 20. September 2017)
DOI: 10.1109/ICIP.2017.8296368
BibTeX: Download
, , , :
Detecting Closely Spaced and Occluded Pedestrians Using Specialized Deep Models for Counting
IEEE Visual Communications and Image Processing (VCIP) (St. Petersburg, Florida, 10. Dezember 2017 - 13. Dezember 2017)
DOI: 10.1109/VCIP.2017.8305064
BibTeX: Download
, , , :
Pedestrian Counting Using Deep Models Trained on Synthetically Generated Images
International Conference on Computer Vision Theory and Applications (VISAPP) (Porto, Portugal, 27. Februar 2017 - 1. März 2017)
DOI: 10.5220/0006132600860097
BibTeX: Download
, , , :
Finger-Trace Generator for SWYPE Touch Screen Testing Applications
7th IEEE International Conference On Consumer Electronics ICCE (Berlin, 3. September 2017 - 6. September 2017)
DOI: 10.1109/ICCE-Berlin.2017.8210606
BibTeX: Download
, , , , :
2016
Moving Object Detection in the H.264/AVC Compressed Domain
In: APSIPA Transactions on Signal and Information Processing 5 (2016), S. 1-20
ISSN: 2048-7703
DOI: 10.1017/ATSIP.2016.18
BibTeX: Download
, , , :
Identification of Irregular Motion in Automotive Navigation Systems Using Novelty Detection
IEEE Symposium Series on Computational Intelligence SSCI (Athens, 6. Dezember 2016 - 9. Dezember 2016)
DOI: 10.1109/SSCI.2016.7850000
BibTeX: Download
, , , , :
2015
Compressed domain moving object detection by spatio-temporal analysis of H.264/AVC syntax elements
31st Picture Coding Symposium, PCS 2015 - with 2015 Packet Video Workshop, PV 2015 (Cairns, 31. Mai 2015 - 3. Juni 2015)
DOI: 10.1109/PCS.2015.7170091
BibTeX: Download
, , , :
Hybrid person detection and tracking in H.264/AVC video streams
10th International Conference on Computer Vision Theory and Applications, VISAPP 2015 (Berlin, 11. März 2015 - 14. März 2015)
DOI: 10.5220/0005296704780485
BibTeX: Download
, , , , :
2014
Real-time motion classification of HD video sequences on embedded systems
6th European Embedded Design in Education and Research Conference, EDERC 2014 (Milano, 11. September 2014 - 12. September 2014)
DOI: 10.1109/EDERC.2014.6924379
BibTeX: Download
, , , , :
2013
Compressed domain moving object detection based on H.264/AVC macroblock types
8th International Conference on Computer Vision Theory and Applications, VISAPP 2013 (Barcelona, 21. Februar 2013 - 24. Februar 2013)
DOI: 10.5220/0004296602190228
BibTeX: Download
, , , :
BM3D-verfeinerte Zwischenbildsynthese für unterschiedlich aufgelöste Referenzansichten
15. ITG-Fachtagung für Elektronische Medien (Dortmund, 26. Februar 2013 - 27. Februar 2013)
In: 15. ITG-Fachtagung für Elektronische Medien, Dortmund, Deutschland: 2013
DOI: 10.17877/DE290R-5368
BibTeX: Download
, , :
A novel similarity-invariant line descriptor for geometric map registration
2013 20th IEEE International Conference on Image Processing, ICIP 2013 (Melbourne, VIC, 15. September 2013 - 18. September 2013)
DOI: 10.1109/ICIP.2013.6738621
BibTeX: Download
, , , , :
Comparative image quality assessment using free energy minimization
2013 38th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2013 (Vancouver, BC, 26. Mai 2013 - 31. Mai 2013)
DOI: 10.1109/ICASSP.2013.6637980
BibTeX: Download
, :
A dual-model approach to blind quality assessment of noisy images
2013 Picture Coding Symposium, PCS 2013 (San Jose, CA, 8. Dezember 2013 - 11. Dezember 2013)
DOI: 10.1109/PCS.2013.6737675
BibTeX: Download
, , , :
Retina model inspired image quality assessment
2013 IEEE International Conference on Visual Communications and Image Processing, IEEE VCIP 2013 (Kuching, Sarawak, 17. November 2013 - 20. November 2013)
DOI: 10.1109/VCIP.2013.6706367
BibTeX: Download
, , , :
2012
Shape Adaptive Mean Shift Object Tracking Using Gaussian Mixture Models
In: N. Adami, A. Cavallaro, R. Leonardi, P. Migliorati (Hrsg.): Analysis, Retrieval and Delivery of Multimedia Content, New York, NY: Springer, 2012, S. 107-122 (Lecture Notes in Electrical Engineering, Bd.158)
ISBN: 978-1-4614-3831-1
DOI: 10.1007/978-1-4614-3831-1_7
BibTeX: Download
, :
Blind frame freeze detection in coded videos
29th Picture Coding Symposium, PCS 2012 (Krakow, 7. Mai 2012 - 9. Mai 2012)
DOI: 10.1109/PCS.2012.6213315
BibTeX: Download
, , , , :
Freeze detection in 2D navigation video sequences by matching of extracted line segments
2012 IEEE International Conference on Vehicular Electronics and Safety, ICVES 2012 (Istanbul, 24. Juli 2012 - 27. Juli 2012)
DOI: 10.1109/ICVES.2012.6294329
BibTeX: Download
, , , , :
2011
A compressed domain change detection algorithm for RTP streams in video surveillance applications
3rd IEEE International Workshop on Multimedia Signal Processing, MMSP 2011 (Hangzhou, 17. Oktober 2011 - 19. Oktober 2011)
DOI: 10.1109/MMSP.2011.6093838
BibTeX: Download
, , , :
AUTO GMM-SAMT: An automatic object tracking system for video surveillance in traffic scenarios
In: Eurasip Journal on Image and Video Processing 2011 (2011), S. 14
ISSN: 1687-5176
DOI: 10.1155/2011/814285
BibTeX: Download
, :
Mean shift object tracking using a 4d kernel and linear prediction
International Conference on Computer Vision Theory and Application, VISAPP 2011 (Vilamoura, Algarve, 5. März 2011 - 7. März 2011)
DOI: 10.5220/0003327305880593
BibTeX: Download
, , :
Boosting based object detection using a geometric model
2011 18th IEEE International Conference on Image Processing, ICIP 2011 (Brussels, 11. September 2011 - 14. September 2011)
DOI: 10.1109/ICIP.2011.6116487
BibTeX: Download
, , , :
Introduction to the issue on recent advances in video processing for consumer displays
In: IEEE Journal of Selected Topics in Signal Processing 5 (2011), S. 213-216
ISSN: 1932-4553
DOI: 10.1109/JSTSP.2011.2109130
BibTeX: Download
, , , :
2010
Shape Adaptive Mean Shift Object Tracking Using Gaussian Mixture Models
11th IEEE International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS) (Desenzano del Garda, 12. April 2010 - 14. April 2010)
URL: https://ieeexplore.ieee.org/document/5617670
BibTeX: Download
, :
Real-time moving object detection in video sequences using spatio-temporal adaptive Gaussian mixture models
5th International Conference on Computer Vision Theory and Applications, VISAPP 2010 (Angers, 17. Mai 2010 - 21. Mai 2010)
URL: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=77956329028∨igin=inward
BibTeX: Download
, , :
Blind GOP structure analysis of MPEG-2 and H.264/AVC decoded video
28th Picture Coding Symposium, PCS 2010 (Nagoya, 8. Dezember 2010 - 10. Dezember 2010)
DOI: 10.1109/PCS.2010.5702480
BibTeX: Download
, , :
A no-reference blocking artifacts visibility estimator in images
2010 17th IEEE International Conference on Image Processing, ICIP 2010 (Hong Kong, 26. September 2010 - 29. September 2010)
DOI: 10.1109/ICIP.2010.5652927
BibTeX: Download
, , :
2009
Temporal trajectory aware video quality measure
In: IEEE Journal of Selected Topics in Signal Processing 3 (2009), S. 266-279
ISSN: 1932-4553
DOI: 10.1109/JSTSP.2009.2015375
BibTeX: Download
, , , , :
Scale and shape adaptive mean shift object tracking in video sequences
17th European Signal Processing Conference, EUSIPCO 2009 (Glasgow, 24. August 2009 - 28. August 2009)
DOI: 10.5281/zenodo.41559
BibTeX: Download
, :
2008
Low-Complexity Heterogeneous Video Transactions using Data Mining
In: IEEE Transactions on Multimedia 10 (2008), S. 286-299
ISSN: 1520-9210
DOI: 10.1109/TMM.2007.911838
BibTeX: Download
, , , , , , :
2007
Temporal registration using 3D phase correlation and a maximum likelihood approach in the perceptual evaluation of video quality
2007 IEEE 9Th International Workshop on Multimedia Signal Processing, MMSP 2007 (Chania, Crete, 1. Oktober 2007 - 3. Oktober 2007)
DOI: 10.1109/MMSP.2007.4412851
BibTeX: Download
, , , :
Perceptually motivated spatial and temporal integration of pixel based video quality measures
Mobile Content Quality of Experience, MobConQoE '07 (Vancouver, BC, 14. August 2007 - 17. August 2007)
DOI: 10.1145/1577504.1577508
BibTeX: Download
, , , , :
2006
Comparison of Matching Strategies for Temporal Frame Registration in the Perceptual Evaluation of Video Quality
2nd International Workshop on Video Processing and Quality Metrics for Consumer Electronics (Scottsdale, Arizona, 22. Januar 2006 - 24. Januar 2006)
BibTeX: Download
, , , :
Influence of the presentation time on subjective votings of coded still images
2006 IEEE International Conference on Image Processing, ICIP 2006 (Atlanta, GA, 8. Oktober 2006 - 11. Oktober 2006)
DOI: 10.1109/ICIP.2006.312449
BibTeX: Download
, , , :
2005
Subjektiver Videobetrachtungstest für niederratige Multimedia-Szenarien
Elektronische Medien: 11. Dortmunder Fernsehseminar, ITG-Fachbericht, (, 9. September 2005 - 10. September 2005)
BibTeX: Download
, , :
Model based segmentation of motion fields in compressed video sequences using partition projection and relaxation
Visual Communications and Image Processing 2005 (Beijing)
DOI: 10.1117/12.631458
BibTeX: Download
, , , :
Stochastic Motion Coherency Analysis for Motion Vector Field Segmentation on Compressed Video Sequences
6th Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS), Montreux, Switzerland (, 13. April 2005 - 15. April 2005)
BibTeX: Download
, , , :
Bayesian method for motion segmentation and tracking in compressed videos
In: Computer Science 3663 (2005), S. 277-284
ISSN: 1508-2806
DOI: 10.1007/11550518_35
BibTeX: Download
, , , :
Additive non-Gaussian noise attacks on the scalar Costa scheme (SCS)
Proceedings of SPIE-IS and T Electronic Imaging - Security, Steganography, and Watermarking of Multimedia Contents VII (San Jose, CA, 17. Januar 2005 - 20. Januar 2005)
In: Delp III E.J.; Wong P.W. (Hrsg.): Proceedings of SPIE-IS and T Electronic Imaging - Security, Steganography, and Watermarking of Multimedia Contents VII 2005
DOI: 10.1117/12.587492
BibTeX: Download
, , , , :
2004
Temporal video segmentation using global motion estimation and discrete curve evolution
2004 International Conference on Image Processing, ICIP 2004 (Singapore, 24. Oktober 2004 - 27. Oktober 2004)
DOI: 10.1109/ICIP.2004.1418771
BibTeX: Download
, , , , :
2003
Optimality of SCS Watermarking
Security and Watermarking of Multimedia Contents V (Santa Clara, CA)
DOI: 10.1117/12.477329
BibTeX: Download
, , , :
Steganographic System Based on Higher-Order Statistics
Security and Watermarking of Multimedia Contents V (Santa Clara, CA)
DOI: 10.1117/12.477301
BibTeX: Download
, , , :
2002
Video analysis for universal multimedia messaging
5th IEEE Southwest Symposium on Image Analysis and Interpretation, SSIAI 2002 (Santa Fe, 7. April 2002 - 9. April 2002)
DOI: 10.1109/IAI.2002.999920
BibTeX: Download
, , , :
Automatic video structuring for multimedia messaging
11th European Signal Processing Conference, EUSIPCO 2002 (Toulouse, 3. September 2002 - 6. September 2002)
URL: https://www.scopus.com/inward/record.uri?partnerID=HzOxMe3b&scp=84960886243&origin=inward
BibTeX: Download
, , , :
2000
Adaptive Multimedia Messaging Based on MPEG-7 - The M3-Box
Second International Symposium on Mobile Multimedia Systems and Applications (Delft, 9. November 2000 - 10. November 2000)
BibTeX: Download
, , :
Visual Feature Discrimination versus Compression Ratio for Polygonal Shape Descriptors
Internet Multimedia Management Systems, SPIE (Boston, Mass., 6. November 2000 - 7. November 2000)
BibTeX: Download
, :
Polygonal Shape Descriptors - An Efficient Solution for Image Retrieval and Object Localization
34th Asilomar Conference on Signals, Systems, and Computers (Pacific Grove, 29. Oktober 2000 - 1. November 2000)
BibTeX: Download
, :
Plug and Play for Mobile Users
In: Siemens CIO Journal, 2000, S. 11-12
BibTeX: Download
, :
1999
Fast Estimation of an Expressive Global Motion Description in Block Coded Sequences
Workshop on Image Analysis for Multimedia Interactive Services (Berlin, 31. Mai 1999 - 1. Juni 1999)
BibTeX: Download
, :
Global Motion Estimation in Image Sequences Using Robust Motion Vector Field Segmentation
ACM Multimedia 99 (Orlando, Florida, 30. Oktober 1999 - 5. November 1999)
BibTeX: Download
, :
1998
Schnelle Bestimmung von Kamerabewegungen in blockbasiert codierten Videosequenzen
In: Proceedings 20. DAGM-Symposium Mustererkennung 1998
BibTeX: Download
, , :
1995
Bayesian Algorithms for Adaptive Change Detection in Image Sequences Using Markov Random Fields
In: Signal Processing-Image Communication 7 (1995), S. 147-160
ISSN: 0923-5965
BibTeX: Download
, :
On Texture Analysis: Local Energy Transforms Versus Quadrature Filters
In: Signal Processing 45 (1995), S. 173-181
ISSN: 0165-1684
BibTeX: Download
, , :
Modelle zur regionenorientierten Bildbeschreibung (Dissertation, 1995)
BibTeX: Download
:
1994
Disparity-based Segmentation of Stereoscopic foreground/background Image Sequences
In: IEEE Transactions on Communications 42 (1994), S. 673-679
ISSN: 0090-6778
BibTeX: Download
, :
Stochastic Model-Based Image Segmentation Using Functional Approximation
In: IEICE Transactions on Fundamentals of Electronics Communications and Computer Sciences E77-A (1994), S. 1451-1456
ISSN: 0916-8508
BibTeX: Download
, :
Segment-Oriented Coding of Texture Images Based on Successive Approximation
IEEE International Symposium on Speech, Image Processing and Neural Networks, Hong Kong (, 13. April 1994 - 16. April 1994)
BibTeX: Download
, :
A Stochastic Model for Image Segmentation Involving Constrained Least Squares Estimation
IEEE International Symposium on Information Theory, Trondheim (, 27. Juni 1994 - 1. Juli 1994)
BibTeX: Download
, :
Ein Modell zur Kompensation örtlicher Wahrnehmungslücken beim menschlichen Sehen basierend auf Lokaler Spektralanalyse
Mustererkennung 1994, Wien (, 21. September 1994 - 23. September 1994)
BibTeX: Download
, :
1993
Statistical Model-Based Change Detection in Moving Video
In: Signal Processing 31 (1993), S. 165-180
ISSN: 0165-1684
DOI: 10.1016/0165-1684(93)90063-G
BibTeX: Download
, , :
Change Detection in Image Sequences Using Gibbs Random Fields: A Bayesian Approach
IEEE International Workshop on Intelligent Signal Processing and Communication Systems, Sendai (, 27. Oktober 1993 - 29. Oktober 1993)
BibTeX: Download
, , :
Modelling the Visual Process of filling in Based on Localised Spectral Image Analysis
Sixteenth European Conference on Visual Perception, Edinburgh, United Kingdom (, 25. August 1993 - 29. August 1993)
BibTeX: Download
, :
Stochastic Model-Based Image Segmentation Using Functional Approximation
IEEE International Workshop on Intelligent Signal Processing and Communication Systems, Sendai (, 27. Oktober 1993 - 29. Oktober 1993)
BibTeX: Download
, :
1992
Estimation of Physical Disparity Fields and their Discontinuities for Stereoscopic Images
European Workshop on 3D-TV Signal Processing: From Capture to Display, Rennes (, 9. November 1992 - 10. November 1992)
BibTeX: Download
, :
MAP-Estimation of Dense Disparity-Fields for Stereoscopic Images
2nd Singapore Intern. Conf. on Image Processing, Singapore (, 7. September 1992 - 11. September 1992)
BibTeX: Download
, :
Ein approximationstheoretischer Ansatz zur effizienten Texturanalyse
Mustererkennung 1992, Serie Informatik Aktuell, Berlin, Springer Verlag (, 14. September 1992 - 16. September 1992)
BibTeX: Download
, :
A New Approach Towards Description of Arbitrarily Shaped Image Segments
IEEE International Workshop on Intelligent Signal Processing and Communication Systems, Taipei (, 19. März 1992 - 21. März 1992)
BibTeX: Download
, :
1991
Partitioning of Stereoscopic Sequences by Evaluation of Stereo Disparity and Temporal Change Detection
Picture Coding Symposium, Tokyo (, 2. September 1991 - 4. September 1991)
BibTeX: Download
, :
A Statistical Framework for Change Detection in Image Sequences
13ieme Colloque sur le Traitement du Signal et des Images, Juan-Les-Pins (, 16. September 1991 - 20. September 1991)
BibTeX: Download
, , :
1990
Disparity-Based Segmentation of Stereoscopic Images
2nd Workshop on Stereoscopic Television, Darmstadt (, 27. September 1990 - 28. September 1990)
BibTeX: Download
, :
Combined Displacement Estimation and Segmentation of Stereo Image Pairs based on Gibbs Random Fields
IEEE International Conference on Acoustics, Speech, and Signal Processing, Albuquerque (, 3. April 1990 - 6. April 1990)
BibTeX: Download
, , :