Bei Nuscheln rot!

Pressemitteilung / 10. Dezember 2020

Wissenschaftlerinnen und Wissenschaftler am Fraunhofer IDMT in Oldenburg entwickeln Lösungen, mit denen die Verständlichkeit von Sprache in Medien verbessert werden soll. Algorithmen zur automatischen Messung, Bewertung und Darstellung der Sprachverständlichkeit erleichtern die Arbeit von Tonschaffenden bei Film-, Game- und Audio-Produktionen. Mit der Implementierung der Intelligibility-Technologie in die aktuelle Produktionslösung Nuendo des Anbieters Steinberg zeigt nun eine Ampel an, wie gut das gesprochene Wort objektiv von Zuhörenden verstanden wird.

Das Speech Intelligibility Meter in Steinbergs Nuendo 11: Das Werkzeug für Tonschaffende mit Algorithmen des Fraunhofer IDMT in Oldenburg liefert eine instrumentelle Bewertung der Sprachverständlichkeit.
© Steinberg Media Technologies GmbH
Das Speech Intelligibility Meter in Steinbergs Nuendo 11: Das Werkzeug für Tonschaffende mit Algorithmen des Fraunhofer IDMT in Oldenburg liefert eine instrumentelle Bewertung der Sprachverständlichkeit.

Insbesondere ältere Menschen empfinden es als schwierig oder ermüdend, den Wortbeiträgen in einem Film, im Radio oder einer TV-Serie zu folgen. Damit die Dialoge in Medien immer optimal verständlich abgemischt werden können, hat der Anbieter Steinberg die neueste Version 11 seiner Produktionslösung Nuendo mit einem neuen Modul auf Grundlage von Algorithmen des Fraunhofer IDMT ausgestattet. Das neue Feature analysiert eingehende Audiosignale über ein Sprachverständlichkeitsmodell mit automatischer Spracherkennungstechnologie und berechnet, wie viel Anstrengung der Zuhörende aufbringen muss, um das gesprochene Wort innerhalb der Mischung zu verstehen. »Das Tool misst die objektive Sprachverständlichkeit bei der Medienproduktion in Echtzeit. Das mit künstlicher Intelligenz gesteuerte, sogenannte Intelligibility Meter basiert auf hochentwickelten Algorithmen, die am „Hörstandort“ in Oldenburg entwickelt wurden«, erklärt Dr. Jan Rennies-Hochmuth, Gruppenleiter Persönliche Hörsysteme am Fraunhofer IDMT.


Demographischer Wandel und akustische Annäherung

»Um unterschiedlichen Hörvorlieben und mit dem demographischen Wandel verbundenen Hörverlusten gerecht zu werden, ist es für Produzierende und Tonschaffende wichtig, sich an das tatsächliche Hörvermögen von Endnutzerinnen und Endnutzern objektiv annähern zu können. Wir sind froh, unseren Kundinnen und Kunden nun mit dem Intelligibility Meter eine wesentliche Erweiterung des Nuendo-Produktes zur Verfügung stellen zu können«, erläutert Timo Wildenhain, Head of ProAudio bei der Steinberg Media Technologies GmbH.

Das am Fraunhofer IDMT entwickelte Verfahren basiert auf neuronalen Netzen und ermöglicht anwendungsübergreifend eine automatische und zielgruppenspezifische Messung der Sprachverständlichkeit. Somit werden nicht nur Tonschaffende in der Postproduktion unterstützt. Auch ein Einsatz direkt am Set oder im Bereich der Beschallungstechnik ist durch die Echtzeitfähigkeit des Verfahrens denkbar.

»Außerdem ist die Technologie interessant für Rundfunk- und Fernsehanstalten, Content Provider und Hersteller aus den Bereichen Home Entertainment, Consumer Electronics und Telekommunikation«, erklärt Dr. Jan Rennies-Hochmuth. »Denn wir adressieren die wesentlichen Faktoren für schlechte Sprachverständlichkeit in der gesamten Produktions- und Distributionskette und möchten für eine größtmögliche Vielfalt von Zielgruppen, Anwendungen und Hörsituationen mit Hilfe innovativer Softwaretechnologien vorhandenen Barrieren auflösen«, so der Fraunhofer-Experte weiter.

 

Hör-, Sprach- und Audiotechnologie HSA am Fraunhofer IDMT in Oldenburg

Ziel des Institutsteils Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer IDMT ist es, wissenschaftliche Erkenntnisse über die Hörwahrnehmung und Mensch-Technik-Interaktionen in technologischen Anwendungen umzusetzen. Schwerpunkte der angewandten Forschung sind die Verbesserung von Klang und Sprachverständlichkeit, die personalisierte Audiowiedergabe sowie die akustische Sprach- und Ereigniserkennung mit Hilfe künstlicher Intelligenz (KI). Einen weiteren Fokus setzt der Institutsteil auf mobile Neurotechnologien, um auch außerhalb des Labors Gehirnaktivitäten zu erfassen und die dabei gewonnenen Daten zu nutzen. Zu den Anwendungsfeldern gehören Consumer Electronics, Verkehr, Automotive, Produktion, Sicherheit, Telekommunikation und Gesundheit. Über wissenschaftliche Kooperationen ist das Fraunhofer IDMT-HSA eng mit der Carl von Ossietzky Universität, der Jade Hochschule und anderen Einrichtungen der Oldenburger Hörforschung sowie der Hochschule Emden/Leer verbunden. Das Fraunhofer IDMT-HSA ist Partner im Exzellenzcluster »Hearing4all«.

Die Weiterentwicklung des Institutsteils Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer-Instituts für Digitale Medientechnologie IDMT in Oldenburg wird gefördert im niedersächsischen Programm »Vorab« durch das Niedersächsische Ministerium für Wissenschaft und Kultur und die VolkswagenStiftung.