BASS – Bewertung und Analyse der Sprachinteraktion mit Smart-Speakern

Entwicklung von Testmethoden und Standard-Protokollen zur Evaluation der Sprachinteraktion mit Smart-Speakern

 

Im Projekt »BASS« soll die technologische Grundlage für Testmethoden und Standard-Protokolle zur Evaluation der Sprachinteraktion mit Smart-Speakern geschaffen werden. Damit soll ein Messsystem auf dem Markt angeboten werden können, das standardisierten Testspezifikationen für Smart-Speaker folgt. Für das Projekt haben sich die Firma HEAD acoustics und das Fraunhofer IDMT in Oldenburg zusammengetan und streben gemeinsam die Entwicklung der neuen Messmethoden an. Der Institutsteil Hör-, Sprach- und Audiotechnologie HSA greift hierfür auf ein an der Universität Oldenburg entwickeltes, auf maschinellem Lernen basierendes Modell zur automatischen Bewertung der Höranstrengung von Sprache zurück, welches das Fraunhofer IDMT bereits weiterentwickelt und umfangreich validiert hat. Das Teilprojekt des Oldenburger Institutsteils umfasst die (Weiter-)Entwicklung referenzfreier Perzeptionsmodelle zur instrumentellen Evaluation von benutzerdefinierter Eingabesprache und synthetischer Ausgabesprache bei Smart-Speaker.

Der Partner HEAD acoustics wird sich vornehmlich der Simulation von Raumakustik, der Implementierung der Messmethodik und der Systemintegration widmen, um langfristig mit »BASS« ein Alleinstellungsmerkmal in dem wachsenden Smart-Speaker-Markt aufzubauen.

Eine erste Testspezifikation für Smart-Speaker wurde bereits standardisiert, jedoch gibt es hier kritische Lücken. Beispielsweise wird innerhalb dieser Spezifikation nicht beschrieben, wie die Qualität von Spracheingaben und -ausgaben von Smart-Speakern getestet werden kann. Zudem fehlt eine Simulation der Raumakustik für das akustische Testszenario.

Mit Hilfe von »BASS« sollen die technologischen Grundlagen geschaffen werden, um in Zukunft ein Messsystem am Markt anbieten zu können, das die genannten Lücken schließt. Immer mehr Hersteller von "klassischen" Soundsystemen und Unterhaltungselektronik wollen in den schnell wachsenden Smart-Speaker-Markt eintreten und dazu ihre Produkte mit Sprachassistenten bekannter Dienstanbieter wie Google, Amazon oder Apple ausstatten. Diese wiederum legen natürlich Wert auf eine gewisse Mindestqualität der verwendeten Komponenten. Ansonsten könnten eventuell auftretende Probleme vom Anwender als Mangel des verwendeten Dienstanbieters wahrgenommen werden. Wie in der Industrie häufig üblich, helfen hier offene Standards, um bereits im Vorfeld von Produktentwicklungen von Smart-Speakern klare Mindestanforderungen zwischen Hersteller und Zulieferer zu definieren. Zudem wird angestrebt, dass die entwickelten neuen Messmethoden Eingang in einen Nachfolge-Standard finden, so dass das entwickelte Messsystem Standard-konform ist, was seine Akzeptanz und Nachfrage erhöhen würde.

 

 

Presseinformation / 12.9.2018

Die »Smart Speaker Story«

Audioexperten des Fraunhofer IDMT in Oldenburg haben mit dem Audiodesign des »Smart Speaker« der Deutschen Telekom viel Klang auf wenig Raum geschaffen. Ein Film gibt nun Einblick in die Entwicklung, den Umfang und die Funktionsweise des Produkts. Dabei spannt er den Bogen von der ersten Ideenfindung über die Konzeptionsphase und die kooperative Zusammenarbeit der Partner bis zur Realisierung einer akustischen End-of-Line Kontrolle für die Produktion.

 

Spracherkennung für Produkte und Prozesse

Spracherkennungssysteme ermöglichen die blickfreie und berührungslose Bedienung von technischen Systemen. Die Spracherkennungssysteme des Fraunhofer IDMT funktionieren unter anspruchsvollen akustischen Bedingungen - mit und ohne Verbindung zum Internet.

 

Institutsteil Hör-, Sprach- und Audiotechnologie

Ziel des Oldenburger Institutsteils Hör-, Sprach- und Audiotechnologie HSA des Fraunhofer IDMT ist es, wissenschaftliche Erkenntnisse über die Hörwahrnehmung und Mensch-Technik-Interaktionen in technologischen Anwendungen umzusetzen. 

Das Projekt BASS wird unter dem Förderkennzeichen KK5048502GR0 im Förderprogramm Zentrales Innovationsprogramm Mittelstand (ZIM) vom Bundesministerium für Wirtschaft und Energie (BMWi) gefördert.

 

Sprachverständlichkeit

Wissenschaftler am Fraunhofer IDMT entwickeln Softwarelösungen, die die Verständlichkeit von Sprache automatisch analysieren und optimieren – zum Beispiel bei Bahnhofsdurchsagen, mobilen Telefonaten oder Navigationssystemen im Auto.