SpeechTrust+ – Erkennung von KI-basierter Sprachsynthese und Stimmverfremdung für Beweismittelprüfung und Schutz vor Betrug und Desinformation

Aufnahmestudio mit Mikrofon und Kopfhörern
© Will Francis/Unsplash

KI-basierte Sprachsynthese ist schon bald in der Lage, menschliche Sprache in so guter Qualität zu generieren, dass sie nicht mehr von natürlicher Sprache zu unterscheiden ist – eine Form sogenannter »Deepfakes«. In naher Zukunft wird es möglich sein, beliebigen Personen beliebige Botschaften in den Mund zu legen. Ohne wirksamen Verfahren zur Erkennung synthetischer Sprache drohen dramatische Folgen für die Prävention und Verfolgung von Betrug, Phishing und Desinformation.

Ziel von SpeechTrust+ ist es, eine neue Generation von Detektoren zu erforschen, die KI-basierte Sprachsynthese und Sprachverfremdungen zuverlässig und nachhaltig erkennen sollen. Dafür werden nicht nur genau die KI-Methoden zur Detektion eingesetzt, die zu den enormen Verbesserungen bei der Sprachsynthese geführt haben, sondern zusätzlich Verfahren aus der Audioforensik verwendet. Durch diese Kombination soll eine Toolbox entstehen, mit der robuste Detektoren bereitgestellt werden können.

Aufgabenbereich des Fraunhofer IDMT

Das Fraunhofer IDMT leitet das Projekt und führt alle Arbeiten zur Erforschung und Entwicklung neuartiger KI-basierter Technologien zur Detektion synthetischer Sprachaufzeichnungen und Stimmverfremdungen im Projekt aus. Mehrere Teams der Standorte Ilmenau und Oldenburg bringen dafür in enger Zusammenarbeit interdisziplinäres Know-how in Maschinellem Lernen, Audioforensik, Anomaliedetektion, Raumakustik, Sprechererkennung und Sprachanalyse ein. Eingesetzt werden dabei unter anderem Erkenntnisse und Verfahren aus den Projekten REWIND und AudioTrust.

Beteiligte Partner

  • Fraunhofer-Institut für Digitale Medientechnologie IDMT
  • DigiFors GmbH
  • Landeskriminalamt Baden-Würtemberg
  • Landeskriminalamt Bayern

Die DigiFors GmbH bringt als hoch spezialisiertes Sachverständigen-Unternehmen seine Expertise in Digitaler Forensik und IT-Sicherheit ins Projekt mit ein, vor allem bezüglich der Bedarfe aus Sicht der forensischen Aufbereitung von Analyseergebnissen und der Evaluation der Projektergebnisse.

Die Landeskriminalämter Baden-Württemberg und Bayern sind als assoziierte Projektpartner für die iterative Anforderungsanalyse und Bewertung der entwickelten Software eingebunden, um so einen hohen Praxisnutzen der Ergebnisse vor allem für die Prävention und Erkennung von Straftaten sicherzustellen. 

Förderer

Das Projekt wird im Rahmen des BMBF-Ausschreibung »Künstliche Intelligenz in der zivilen Sicherheitsforschung II« gefördert (FKZ 13N16267, Laufzeit 01/2022-12/2024).

Laufzeit

Januar 2022 – Dezember 2024