Durchsagen besser verstehen

Software passt Sprache an Umgebungslautstärke an

Presseinformation / 01. Februar 2016

Oldenburg. Lautsprecherdurchsagen an Bahnhöfen sind oftmals unverständlich, weil es in der Umgebung laut ist. Mit einer neuen Software lässt sich deren Verständlichkeit jetzt deutlich verbessern. Ein Mikrofon nimmt die Umgebungsgeräusche auf und passt die Sprache optimal an den Lärmpegel an. Auch Mobilfunkgespräche sind mit Hilfe der Technologie besser zu verstehen.

AdaptDRC — © Fraunhofer IDMT/Daniel Schmidt

Rattert ein Güterzug vorbei, versteht man von einer Durchsage wie »Der Zug nach Frankfurt am Main fährt heute abweichend aus Gleis...« oftmals nur die Hälfte. Forscher der Oldenburger Projektgruppe Hör-, Sprach- und Audiotechnologie des Fraunhofer-Instituts für Digitale Medientechnologie IDMT haben eine Software entwickelt, die die Verständlichkeit von Sprache deutlich verbessert – auch bei den Stimmen von Sprechern auf Konferenzen oder Gesprächen über Mobiltelefone.

Mikrofon analysiert Lärmpegel

Der Trick der ADAPT DRC genannten Software besteht darin, dass der Lärm in der Umgebung über ein Mikrofon permanent analysiert und die Sprache in Echtzeit daran angepasst wird. »Dabei reicht es nicht, die Stimme über Lautsprecher oder Mobiltelefon einfach lauter zu machen, um den Lärm zu übertönen«, sagt Projektleiter Dr. Jan Rennies-Hochmuth. Derlei Technologien werden heute schon beim Autoradio eingesetzt, dadurch wird die Stimme zwar lauter, aber nicht unbedingt besser verständlich, weil bei hohen Lautstärken die Boxen an ihre Grenzen stoßen und klirren. »Sprache ist deutlich komplexer«, sagt Rennies-Hochmuth. Zum einen kommt es darauf an, bestimmte Tonhöhen, die Frequenzen, gezielt zu verstärken. Vokale sind relativ tiefe und langgezogene Wortteile, die gut zu verstehen sind. Konsonanten wie »p«, »t« und »k« hingegen sind sehr kurz und haben höhere Frequenzen. Sie sind in lauter Umgebung in der Regel weniger gut zu verstehen, für das Sprachverständnis aber sehr wichtig. So hängt zum Beispiel vom Konsonanten ab, ob der Empfänger »Kasse« oder »Tasse« versteht. »Unsere Algorithmen sind in der Lage, bestimmte Frequenzen zu gewichten und zum richtigen Zeitpunkt genau jene zu verstärken, die durch die Umgebungsgeräusche besonders gestört werden«, ergänzt Rennies-Hochmuth.

Leise Sprachanteile verstärken

Zum zweiten berücksichtigt die Software auch die unterschiedlich lauten Anteile des Sprachsignals. Da sich gesprochene Sprache aus lauten und leisen Teilen zusammensetzt, sprechen Fachleute von Sprachdynamik. Die Sprachverständlichkeit erhöht sich vor allem dann, wenn laute Anteile gezielt gedämpft, leise Anteile gezielt verstärkt werden. Diese Technik wird Dynamic Range Compression genannt (DRC). Das ist beispielsweise auch dann von Interesse, wenn man mit einem Mobiltelefon an einer lauten Straße telefoniert. Die ADAPT DRC-Software ist bereits bis zur Anwendungsreife entwickelt und steht Industriepartnern zur Verfügung. Da Mobiltelefone oder Anlagen für Konferenzen heute bereits über eingebaute Mikrofone verfügen, bringen die Geräte schon die erforderliche Technologie mit, um den Umgebungslärm aufnehmen zu können. Für Lautsprecheranlagen auf Bahnhöfen oder in Flughäfen müssten zunächst zusätzliche Mikrofone installiert werden.

Auch Schwerhörige profitieren

»Wie Untersuchungen am IDMT gezeigt haben, erleichtert die neue Software auch Schwerhörigen das Verstehen von Lautsprecherdurchsagen oder der Stimme am Handy. Für gewöhnlich sind Personen ganz unterschiedlich schwerhörig, sodass Hörgeräte individuell angepasst werden müssen. Insofern waren wir positiv überrascht, dass die Verbesserung von Lautsprecherdurchsagen oder der Stimme im Handy oder Headset mithilfe von ADAPT DRC bei Schwerhörigen offenbar allgemein das Sprachverständnis verbessert«, sagt Dr. Jan Rennies-Hochmuth, Gruppenleiter »Persönliche Hörsysteme« am IDMT.

Über die Projektgruppe für Hör-, Sprach- und Audiotechnologie des Fraunhofer-Instituts für Digitale Medientechnologie IDMT

Ziel der Projektgruppe Hör-, Sprach- und Audiotechnologie ist es, wissenschaftliche Erkenntnisse über die Hörwahrnehmung des normalen und des beeinträchtigten Gehörs in technologische Anwendungen umzusetzen. Im Auftrag von Industrieunternehmen und öffentlichen Einrichtungen betreiben die Wissenschaftler angewandte Forschung und Entwicklung für die Branchen Telekommunikation, Multimedia, Gesundheit und Pflege, Gebäudetechnik, Verkehr, industrielle Produktion und Sicherheit. Die Projektgruppe wurde 2008 in Oldenburg als Außenstelle des Fraunhofer-Instituts für Digitale Medientechnologie IDMT gegründet. Über wissenschaftliche Kooperationen ist sie im Exzellenzcluster »Hearing4all« eng mit der Carl von Ossietzky Universität und weiteren Einrichtungen der Oldenburger Hörforschung verbunden.