Um Forschungsdaten aus mehreren Projekten und Studien zusammenführen und einer einzigen Person zuordnen zu können (Record Linkage), ist sowohl ein Dublettenverfahren als auch eine eineindeutige systemweite Kennung erforderlich, der sowohl die personenidentifizierenden Daten, als auch die einzelnen lokalen Kennungen des Quellsystems (z.B. Labore, Studienzentralen, etc.) zugeordnet sind. Da dies auch bei unvollständigen oder fehlerhaften Personendaten fehlertolerant und nachvollziehbar erfolgen muss, ist ein nachhaltiges Record Linkage und Identitäten-Management erforderlich.
Der E-PIX ermöglicht ein probabilistisches Record Linkage und setzt das Konzept eines Master Patient Index um. Das integrierte Identitätenkonzept erlaubt potentielle Synonymfehler automatisch zu erkennen und unterstützt bei deren grafischer Auflösung. Die Erkennung von Dubletten erfolgt auf Basis frei definierbarer Parameter und der Levenshtein-Distanz. Mögliche Synonymfehler werden so protokolliert und können im Nachhinein über entsprechende Funktionen aufgelöst werden.
Download
Sie haben Interesse an unserem E-PIX? Sie können ihn herunterladen und mittels Docker installieren oder vorab in unserer Live Demo ausprobieren.
Dokumentation
Verbreitung
Die Darstellung zeigt produktive (rot) und geplante Vorhaben (hellrot), Dezember 2024