Stimmenauthentifizierung

Sprecherinnen- und Sprecherauthentifizierung ist überall dort wichtig, wo Menschen sprechen und eindeutig erkannt werden sollen. Das kann sowohl bei der Mensch-Maschine-Interaktion der Fall sein als auch bei Gesprächen zwischen mehreren Personen.

Nur wenige Sekunden Audiomaterial reichen aus, um mit Hilfe intelligenter Algorithmen eine sprechende Person zu identifizieren. Das heißt aktuelle Daten werden mit bereits bekannten vergleichen, um zu bestätigen oder falsifizieren, dass die Daten ähnlich sind. So lässt sich beispielsweise herausfinden, ob in verschiedenen Audioaufnahmen dieselbe Person spricht.

Wir können aber durch die Unterscheidung der einzelnen Sprechenden nicht nur einschätzen, wer gerade in der Aufnahme spricht. Sondern auch, wo und wie viele Personen in der gesamten Aufnahme zu hören sind. Zusätzlich identifizieren wir die gesprochene Sprache in der Audiodatei.

In der Produktion

Wenn in Produktionsumgebungen identifiziert werden soll, welche Person gerade spricht, kommen die intelligenten Algorithmen des Fraunhofer IDMT aus Oldenburg zum Einsatz. Gerade dann, wenn bestimmte Maschinen nur von autorisierten Nutzenden bedient werden dürfen, ist es wichtig zu wissen, wer den Befehl gerade spricht. Sollte die Maschine erkennen, dass die Bedienerin oder der Bediener nicht autorisiert ist, wird sie nicht angesteuert.

Um weiteren Personen Zugriff zu ermöglichen, kann innerhalb weniger Sekunden mit unserer Sprecherinnen- und Sprechererkennung eine neue SpeakerID angelegt werden. Im Anschluss ist die neue Bedienerin oder der neue Bediener befähigt, ebenfalls Sprachbefehle an der Maschine auszuführen. In unserem Industriearbeitskreis »Audiotechnologie für die intelligente Produktion AiP« arbeiten wir zusammen mit den Industriepartnern an den Einsatzmöglichkeiten dieser Technologie in der Praxis.

Broadcasting

Wenn einzelne Sprechende identifiziert werden können, ist das auch eine Möglichkeit, um beispielsweise Medienarchive gezielt zu durchsuchen. Spricht auf mehreren Aufnahmen dieselbe Person, kann das herausgefiltert werden. Es ist eine möglich zu erkennen, wie viel Redeanteil welche Person hat, um hiernach gezielt zu filtern. Sucht man nur nach Inhalten in einer bestimmten Fremdsprache, kann auch das dank der intelligenten Algorithmen extrahiert werden. 

In sicherheitsrelevanten Bereichen

Über die Stimme lässt sich eine einzelne Person identifizieren, ähnlich wie bei einem Fingerabdruck. In Kombination mit anderen biometrischen Identifikationsmerkmalen, etwa der Gesichtserkennung, kann die Sprechererkennung in sicherheitsrelevanten Bereichen eingesetzt werden. Beispielsweise lässt sich im Bereich der Forensik damit auf Tonaufnahmen die Identität einer Sprecherin oder eines Sprechers feststellen. 

In der Gesundheitswirtschaft

Gruppenübergreifend setzen wir am Fraunhofer IDMT auf vielfältige Einsatzmöglichkeiten unserer Technologien. Die Sprecherinnen- und Sprecherauthentifizierung lässt sich auch für das Monitoring von Sprech- und Stimmstörungen verwenden. Zugleich kann sie für die Überprüfung des Fortschritts bei logopädischen Maßnahmen verwendet werden.

Stimmbasiertes User Management in der Produktion

Datenschutz und Datenverarbeitung

Wir setzen zum Einbinden von Videos den Anbieter YouTube ein. Wie die meisten Websites verwendet YouTube Cookies, um Informationen über die Besucher ihrer Internetseite zu sammeln. Wenn Sie das Video starten, könnte dies Datenverarbeitungsvorgänge auslösen. Darauf haben wir keinen Einfluss. Weitere Informationen über Datenschutz bei YouTube finden Sie in deren Datenschutzerklärung unter: https://policies.google.com/privacy

Mit unserer Stimmenauthentifizierung können autorisierte Nutzende Maschinen sicher per Sprachbefehl steuern. In unserem Video zeigen wir Ihnen, wie sich Profile für neue Nutzende anlegen lassen und dass wir auch in lauten Umgebungen Stimmen zuverlässig zuordnen können.

Wir konnten herausfiltern, dass in allen drei Audiobeispielen jeweils die zwei selben Personen sprechen. Das erkennt man an dem hohen Score-Wert.
Aus den Beispiel-Audiodateien konnten drei Sprachen extrahiert werden: Deutsch, Niederländisch und Norwegisch.
Im Detail erkennt man in rot und grün dargestellt die Sprachanteile der zwei Personen, die voneinander getrennt wurden.

Weitere Informationen

 

Presseinformation / 4.11.2021

Besser verstehen

Tonmeistertagung 2021: Das Fraunhofer IDMT stellt Lösungen für die Analyse, Bewertung und Verbesserung von Sprachverständlichkeit vor.

 

Voice Filtering

Unsere Technologie ist in der Lage verschiedene Sprecherinnen und Sprecher innerhalb weniger Sekunden zu erkennen, zu trennen und herauszufiltern.

 

Dein Sound, in jeder Situation

Jeder Mensch hört anders gut. Mit dem »YourSound-Verfahren« lässt sich der Klang von Audio-Devices optimal personalisieren – so einfach wie nie zuvor!

 

Sprachverständlichkeit analysieren und optimieren

Die von uns entwickelten Softwarelösungen sind in der Lage, die Verständlichkeit von Sprache zu messen, anzuzeigen und zu optimieren – auf Wunsch auch automatisch.

 

Audiosignalverbesserung

Wir entwickeln für Sie mit höchster Expertise Software und Hardware zur Verbesserung von akustischen Signalen - für Audiosignale mit echtem Mehrwert.

 

Alle Branchenlösungen auf einen Blick

Hier finden Sie ausführliche Informationen zu all unseren Lösungen des Oldenburger Institutsteils Hör, Sprach- und Audiotechnologie HSA.