BASS – Bewertung und Analyse der Sprachinteraktion mit Smart-Speakern

Entwicklung von Testmethoden und Standard-Protokollen zur Evaluation der Sprachinteraktion mit Smart-Speakern

Im Projekt »BASS« soll die technologische Grundlage für Testmethoden und Standard-Protokolle zur Evaluation der Sprachinteraktion mit Smart-Speakern geschaffen werden. Damit soll ein Messsystem auf dem Markt angeboten werden können, das standardisierten Testspezifikationen für Smart-Speaker folgt. Für das Projekt haben sich die Firma HEAD acoustics und das Fraunhofer IDMT in Oldenburg zusammengetan und streben gemeinsam die Entwicklung der neuen Messmethoden an. Der Institutsteil Hör-, Sprach- und Audiotechnologie HSA greift hierfür auf ein an der Universität Oldenburg entwickeltes, auf maschinellem Lernen basierendes Modell zur automatischen Bewertung der Höranstrengung von Sprache zurück, welches das Fraunhofer IDMT bereits weiterentwickelt und umfangreich validiert hat. Das Teilprojekt des Oldenburger Institutsteils umfasst die (Weiter-)Entwicklung referenzfreier Perzeptionsmodelle zur instrumentellen Evaluation von benutzerdefinierter Eingabesprache und synthetischer Ausgabesprache bei Smart-Speaker.

Der Partner HEAD acoustics wird sich vornehmlich der Simulation von Raumakustik, der Implementierung der Messmethodik und der Systemintegration widmen, um langfristig mit »BASS« ein Alleinstellungsmerkmal in dem wachsenden Smart-Speaker-Markt aufzubauen.

Eine erste Testspezifikation für Smart-Speaker wurde bereits standardisiert, jedoch gibt es hier kritische Lücken. Beispielsweise wird innerhalb dieser Spezifikation nicht beschrieben, wie die Qualität von Spracheingaben und -ausgaben von Smart-Speakern getestet werden kann. Zudem fehlt eine Simulation der Raumakustik für das akustische Testszenario.

Mit Hilfe von »BASS« sollen die technologischen Grundlagen geschaffen werden, um in Zukunft ein Messsystem am Markt anbieten zu können, das die genannten Lücken schließt. Immer mehr Hersteller von "klassischen" Soundsystemen und Unterhaltungselektronik wollen in den schnell wachsenden Smart-Speaker-Markt eintreten und dazu ihre Produkte mit Sprachassistenten bekannter Dienstanbieter wie Google, Amazon oder Apple ausstatten. Diese wiederum legen natürlich Wert auf eine gewisse Mindestqualität der verwendeten Komponenten. Ansonsten könnten eventuell auftretende Probleme vom Anwender als Mangel des verwendeten Dienstanbieters wahrgenommen werden. Wie in der Industrie häufig üblich, helfen hier offene Standards, um bereits im Vorfeld von Produktentwicklungen von Smart-Speakern klare Mindestanforderungen zwischen Hersteller und Zulieferer zu definieren. Zudem wird angestrebt, dass die entwickelten neuen Messmethoden Eingang in einen Nachfolge-Standard finden, so dass das entwickelte Messsystem Standard-konform ist, was seine Akzeptanz und Nachfrage erhöhen würde.

Wir brauchen BASS!

BASS – Bewertung und Analyse der Sprachinteraktion mit Smart-Speakern

Entwicklung von Testmethoden und Standard-Protokollen zur Evaluation der Sprachinteraktion mit Smart-Speakern

Eckdaten

Die »Smart Speaker Story«

Spracherkennung für Produkte und Prozesse

Institutsteil Hör-, Sprach- und Audiotechnologie

Sprachverständlichkeit

Contact Press / Media

Dr. Rainer Huber

Contact Press / Media

Christian Colmer