Voice Filtering

In Audiomischungen sind verschiedene Sprecherinnen und Sprecher zur gleichen Zeit keine Seltenheit – doch manchmal beeinträchtigt dies die Sprachverständlichkeit. Das Fraunhofer IDMT in Oldenburg bietet eine Lösung dafür. Die zuverlässige Erkennung und Trennung verschiedener Sprecherinnen und Sprecher wird durch sogenanntes Voice Filtering ermöglicht, das innerhalb weniger Sekunden den akustischen Fingerabdruck eines Sprechenden erzeugt, um diesen später aus einem Mix mehrerer Sprecherinnen und Sprecher zu extrahieren. Auf Basis unserer Technologie zur Sprecherinnen- und Sprecherauthentifizierung (Link einfügen) werden die verschiedenen Audiosignale aus dem Audiomix herausgefiltert, um eine Trennung der Sprechenden zu ermöglichen.

Voice Filtering kann ebenfalls dazu verwendet werden Hintergrund- oder Störgeräusche aus einem Mix zu entfernen. Dadurch erhöht sich sowohl die Sprachverständlichkeit als auch die Klangqualität.

Voice Filtering bei Hörminderung

Gerade Schwerhörende können in einer Gruppe Probleme haben, sich akustisch auf eine Person zu konzentrieren. Das wird auch als Cocktail-Party-Effekt bezeichnet. Hier können die intelligenten Algorithmen der Voice-Filter-Technologie dabei unterstützen eine Person aus dem komplexen Gemisch herauszufiltern und so die Sprachverständlichkeit zu verbessern.

Voice Filtering in der Telekommunikation

Die Technologie unterstützt nicht zur Schwerhörende bei der Fokussierung auf eine bestimmte sprechende Person, sondern kommt auch in der Telekommunikation oder bei der Übertragung von Sprache über das Internet, also Voice over IP (kurz: VoIP), zum Einsatz. Durch die Minimierung der Störgeräusche erhöht sich die Verständlichkeit der gesprochenen Sprache, etwa bei Online-Meetings, Videokonferenzen oder in Call Centern.

In der Produktion ist das Voice Filtering hilfreich, damit nur eine bestimmte Person einem System Sprachbefehle erteilen kann. Auch hier werden Umgebungsgeräusche sowie weitere Sprechende herausgefiltert werden. Insbesondere in lauten Umgebungen ist das von Vorteil, um beispielsweise die Genauigkeit der Spracherkennung zu erhöhen. Die Voice-Filtering-Technologie kann auch im Sicherheitsbereich zum Einsatz kommen.

Christian Rollwage stellt die Voice-Filter-Technologie vor

Datenschutz und Datenverarbeitung

Wir setzen zum Einbinden von Videos den Anbieter YouTube ein. Wie die meisten Websites verwendet YouTube Cookies, um Informationen über die Besucher ihrer Internetseite zu sammeln. Wenn Sie das Video starten, könnte dies Datenverarbeitungsvorgänge auslösen. Darauf haben wir keinen Einfluss. Weitere Informationen über Datenschutz bei YouTube finden Sie in deren Datenschutzerklärung unter: https://policies.google.com/privacy

Weitere Informationen

 

Presseinformation / 4.11.2021

Besser verstehen

Tonmeistertagung 2021: Das Fraunhofer IDMT stellt Lösungen für die Analyse, Bewertung und Verbesserung von Sprachverständlichkeit vor.

 

Dein Sound, in jeder Situation

Jeder Mensch hört anders gut. Mit dem »YourSound-Verfahren« lässt sich der Klang von Audio-Devices optimal personalisieren – so einfach wie nie zuvor!

 

Sprachverständlichkeit analysieren und optimieren

Die von uns entwickelten Softwarelösungen sind in der Lage, die Verständlichkeit von Sprache zu messen, anzuzeigen und zu optimieren – auf Wunsch auch automatisch.

 

Aktuelles / 30.4.2021

Podcast: Wenn Drohnen drohen...

Ein Podcast mit Christian Rollwage. An Flughäfen oder bei Großveranstaltungen können Drohnen eine Bedrohung darstellen. Um darauf angemessen reagieren zu können, werden Technologien zur Drohnenerkennung und -lokalisationen erforscht.

 

Alle Branchenlösungen auf einen Blick

Hier finden Sie ausführliche Informationen zu all unseren Lösungen des Oldenburger Institutsteils Hör, Sprach- und Audiotechnologie HSA.

 

Audiosignalverbesserung

Wir entwickeln für Sie mit höchster Expertise Software und Hardware zur Verbesserung von akustischen Signalen - für Audiosignale mit echtem Mehrwert.