Echtzeit-Monitoring von Sprachverständlicheit

Sprachverständlichkeit wird vor allem durch Umgebungslärm und Nachhall gestört. In einer Videokonferenz trägt die Anzeige der aktuellen Verständlichkeit zu einer besseren Kommunikation bei.

SI-Live Demo

© Fraunhofer IDMT

Bessere Kommunikation mit Telefon- und Videokonferenzsystemen

In vielen Kommunikationssituationen wird die Sprachverständlichkeit durch Nebengeräusche und Nachhall beeinträchtigt. Am Telefon kann der Sprecher besonders schlecht  einschätzen, wie gut er am anderen Ende der Leitung verstanden wird. Ein Zeitversatz in der Übertragung kann die Kommunikation zusätzlich erschweren.

 

Live-Anzeige der Sprachverständlichkeit

Die  am Fraunhofer IDMT entwickelte, patentierte Softwarelösung SI-Live zeigt den Gesprächspartnern die aktuelle Verständlichkeit des Sprachsignals in Echtzeit an und kann so die Kommunikation am Telefon oder in einer Videokonferenz oder Bildtelefonie deutlich erleichtern: ohne unterbrechende Hinweise können die Teilnehmer die akustische Situation besser berücksichtigen, beispielsweise durch Veränderung der Mikrofonposition, Unterbinden von Störgeräuschen oder deutlicheres Sprechen.

 

Schätzung von Störgeräuschen ohne Referenzsignal

Die Grundlage für die Darstellung der Sprachverständlichkeit ist der Sprachübertragungsindex STI, der den Einfluss von Störgeräusch und Nachhall auf die Sprachverständlichkeit bewertet. Anhand des aufgenommenen Mikrofonsignals schätzt der SI-Live-Algorithmus die Anteile von Hall, Sprach- und Rauschenergie in kurzen Zeitabständen. So ist es möglich, den STI zu berechnen, ohne dass das Ausgangssignal als Referenz vorliegt.