
KI-basierte Sprachsynthese ist schon bald in der Lage, menschliche Sprache in so guter Qualität zu generieren, dass sie nicht mehr von natürlicher Sprache zu unterscheiden ist – eine Form sogenannter »Deepfakes«. In naher Zukunft wird es möglich sein, beliebigen Personen beliebige Botschaften in den Mund zu legen. Ohne wirksamen Verfahren zur Erkennung synthetischer Sprache drohen dramatische Folgen für die Prävention und Verfolgung von Betrug, Phishing und Desinformation.
Ziel von SpeechTrust+ ist es, eine neue Generation von Detektoren zu erforschen, die KI-basierte Sprachsynthese und Sprachverfremdungen zuverlässig und nachhaltig erkennen sollen. Dafür werden nicht nur genau die KI-Methoden zur Detektion eingesetzt, die zu den enormen Verbesserungen bei der Sprachsynthese geführt haben, sondern zusätzlich Verfahren aus der Audioforensik verwendet. Durch diese Kombination soll eine Toolbox entstehen, mit der robuste Detektoren bereitgestellt werden können.