In Audiomischungen sind verschiedene Sprecherinnen und Sprecher zur gleichen Zeit keine Seltenheit – doch manchmal beeinträchtigt dies die Sprachverständlichkeit. Das Fraunhofer IDMT in Oldenburg bietet eine Lösung dafür. Die zuverlässige Erkennung und Trennung verschiedener Sprecherinnen und Sprecher wird durch sogenanntes Voice Filtering ermöglicht, das innerhalb weniger Sekunden den akustischen Fingerabdruck eines Sprechenden erzeugt, um diesen später aus einem Mix mehrerer Sprecherinnen und Sprecher zu extrahieren.
Gerade Schwerhörende können in einer Gruppe Probleme haben, sich akustisch auf eine Person zu konzentrieren. Hier können die intelligenten Algorithmen der Voice-Filter-Technologie dabei unterstützen eine Person aus dem komplexen Gemisch herauszufiltern und so die Sprachverständlichkeit zu verbessern.
Die Anwendungsfelder dieser Technologie reichen über die Medienproduktion hinaus – auch im Bereich Spracherkennung findet sie Anwendung. Beispielsweise kann sie eingesetzt werden, sodass nur eine bestimmte Person einem System Sprachbefehle erteilen kann und Umgebungsgeräusche sowie weitere Sprechende herausgefiltert werden.