Generative Modelle für Inverse Probleme im Audiobereich

Beschreibung

Inverse Probleme befassen sich mit der Schätzung eines unbeobachteten Signals aus degradierten Beobachtungen, die durch einen Vorwärtsprozess erzeugt wurden. Solche Probleme sind grundsätzlich schwierig, da die inverse Abbildung oft schlecht gestellt ist: Lösungen können nicht eindeutig, instabil oder gar nicht existent sein. Im Audiobereich umfassen Beispiele hierfür Stem-Separation, Audio-Enhancement, Rauschunterdrückung und Timbre-Übertragung.

Neuere Ansätze begegnen diesen Herausforderungen, indem sie datengetriebene Priors mit generativen Modellen erlernen. Insbesondere bieten Diffusionsmodelle und Flow Matching einen prinzipienbasierten Rahmen zur Modellierung komplexer Audioverteilungen und zur Lösung inverser Probleme durch iterative oder kontinuierliche Transformationen.

Voraussetzungen

  • Solide Kenntnisse in (statistischer) Signalverarbietung
  • Grundkenntnisse in maschinellem Lernen, insbesondere Deep Learning und generativen Methoden
  • Interesse an Audio- und Musikanwendungen