THESEUS-Forschungsprogramm

Fraunhofer-Institut für Digitale Medientechnologie IDMT

Fraunhofer IDMT prüft Technologien für das »Internet der Zukunft« im THESEUS-Forschungsprogramm

Als einer von 60 Partner im BMWi-Forschungsprogramm »THESEUS« bringt das Thüringer Fraunhofer-Institut für Digitale Medientechnologie IDMT seit 2007 sein Know-how in die Entwicklung und Erprobung einer intelligenten und internetbasierten Infrastruktur für digitale Inhalte ein. Die in THESEUS entwickelten Technologien und Services sollen verfügbare Daten und Wissensbestände im WorldWideWeb besser vernetzen und durch neue Dienste besser nutzbar machen. Ob die Technologien und Anwendungen auch genau das in der Praxis leisten können, prüft das Fraunhofer IDMT. Die Ergebnisse der Arbeiten werden bei der Abschlussveranstaltung des Core Technology Clusters am 8. und 9. Dezember 2011 in Berlin vorgestellt und diskutiert.

Im THESEUS-Forschungsprogramm werden zukunftsträchtige Technologien und Anwendungen entwickelt, die digitale Inhalte erfassen, einordnen und verknüpfen können. Auf diese Weise sollen Computer selbständig logische Schlüsse und Zusammenhänge aus verschiedenen Informationen herstellen. Im Ergebnis entstehen neue Dienstleistungen und Tools, die die Internetrecherche und Suche nach spezifischen Inhalten erheblich vereinfachen werden.

Dass die im Rahmen von THESEUS entwickelten Basistechnologien auch in verschiedenen Anwendungsszenarien zum Einsatz kommen können und in der Praxis das leisten, was man sich von ihnen verspricht, dafür sorgt das THESEUS Core Technology Cluster (CTC). Als Teil des CTC übernimmt das Ilmenauer Fraunhofer IDMT seit 2007 die Evaluation der grundlegenden Technologiebausteine im Audio-, Video- und Multimediabereich, die von den Partnern im THESEUS CTC entwickelt wurden. Die Fraunhofer-Forscher überprüfen und bewerten beispielsweise, ob Algorithmen zur Sprach- und Bilderkennung, Nutzerschnittstellen oder die automatische Zuordnung von Metadaten die zuvor definierten Anforderungskriterien erfüllen und in der Praxis zu verlässlichen Resultaten führen. »Im Verlauf der fünfjährigen Laufzeit des Forschungsprogramms haben wir in Ilmenau über 90 Evaluationen durchgeführt«, so Prof. Dr. Thomas Sporer, der für die Evaluation am Fraunhofer IDMT verantwortlich ist. Die Ergebnisse der Evaluation fließen anschließend wieder in den Design- und Entwicklungsprozess der Basistechnologien ein.

Wie diese objektive Qualitätsbewertung am Fraunhofer IDMT tatsächlich funktioniert, erklärt Thomas Sporer anhand der getesteten Algorithmen zur Erkennung von Texten und Handschriften in Bilddaten: »Verfahren zur Text- oder Schrifterkennung spielen vor allem in solchen Bereichen eine Rolle, in denen man Dokumente automatisch einscannen, also digitalisieren möchte. Auf diese Weise können bestimmte Inhalte in Datenbanken, wie z. B. Patientenunterlagen einer Klinik, ganz unkompliziert gefunden werden. Sucht ein Arzt etwa nach geeigneten Therapiemöglichkeiten für einen Patienten, sollen zukünftig Computerprogramme automatisch vergleichende Krankheitsbilder, Röntgenaufnahmen oder Behandlungsformen in wenigen Minuten anzeigen können. Das System muss dabei so intelligent sein und unterscheiden können, ob die Röntgenbilder eines Erwachsenen oder eines Kindes in der Datenbank vorliegen. Dazu müssen PC-Programme neben Texten auch handschriftliche Vermerke auslesen können. Zur Überprüfung dieser Techniken haben wir beispielsweise eingescannte Karteikarten genutzt. Das Erkennungssystem sollte in der Lage sein, handgeschriebene Zeichen, Druckbuchstaben, Schriftarten oder auch mathematische Zahlen zu unterscheiden. Darüber hinaus haben wir getestet, wie gut die Software arbeitet, wenn z. B. das Dokument verfärbt ist oder schräg im Scanner lag. Diese verschiedenen Szenarien haben wir simuliert und geprüft. Die Erkennungsrate der Software war dabei überaus positiv. Besonders überrascht hat uns die Erfolgsquote beim Erkennen von schief eingescannten Dokumenten sowie bei kursiver Schrift – hier hat die Software durchweg gute Resultate erzielt«.

Daneben untersuchen die Ilmenauer Forscher auch die intelligente Verknüpfung von Daten. So erfordern bestimmte Anwendungsszenarien, wie der beschriebene computergestützte Vergleich von Krankendaten, auch die Unterscheidung medizinischer Fachwörter von alltagssprachlichen Formulierungen oder Personendaten. Ebenso müssen verschiedene Begriffe für Arzneimittel oder Synonyme für Krankheiten entsprechend zugeordnet werden – z. B. »blauer Fleck«, »Hämatom« oder »Bluterguss«.

»Mit den in THESEUS entwickelten Basistechnologien und technischen Standards wird es möglich, Daten systematisch zu erfassen, zu speichern und gezielt nach Inhalten in Datenbanken zu suchen. Statt vieler Verweise erhält der Anwender zukünftig eine konkrete Antwort – ob bei der Recherche im Internet oder beim Durchsuchen von Datenbanken. Das verkürzt Prozesse erheblich und Nutzer finden intuitiv genau die Informationen, die sie benötigen. Nach Abschluss des THESEUS-Forschungsprogramms werden derartige Technologien und Anwendungen in neuen Services und Diensten auch für Privatnutzer, Unternehmen und Einrichtungen zur Verfügung stehen«, zieht Thomas Sporer eine positive Bilanz.