STB: Abteilungsübergreifendes Zentrum B: Data Science

Beschreibung

Hochwertige Forschungsdaten sind für die epidemiologische Forschung unerlässlich. Im Allgemeinen ist es allerdings nicht möglich, das Potenzial der Forschungsdaten, die in einzelnen Forschungsprojekten erzeugt werden, voll auszuschöpfen, da diese in der Regel einen engen Fokus haben und von begrenzter Dauer sind. Diese Daten bieten häufig die Möglichkeit, weitere Fragen zu untersuchen, die zum Zeitpunkt des Projektbeginns noch nicht absehbar waren oder im Rahmen des Einzelprojekts nicht beantwortet werden konnten. Um dieses Potenzial im Sinne einer effizienten Ressourcennutzung voll auszuschöpfen, wird deswegen zunehmend gefordert, Forschungsdaten zu veröffentlichen und sie mit externen Forschenden zu teilen (Data Sharing). Zu diesem Zweck sollten Forschungsdaten nach den sogenannten FAIR-Prinzipien bereitgestellt werden: Nach diesen Grundsätzen sollen Forschungsdaten auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und von Dritten wiederverwendbar (Reusable) sein. Dies bedeutet, dass datenerzeugende Einrichtungen wie das BIPS den Aufwand für die Datenaufbereitung und -dokumentation deutlich erhöhen müssen, um eine sinnvolle Nutzung durch Dritte unter Einhaltung aller rechtlichen und ethischen Anforderungen zu ermöglichen. Gleichzeitig bietet die gemeinsame Nutzung von Daten die Möglichkeit, die eigene Forschung durch die zusätzliche Analyse externer Datenquellen zu erweitern und neue Forschungsfragen durch die Kombination verschiedener externer Datenquellen mit eigenen Daten zu entwickeln.

Das abteilungsübergreifende Zentrum für Forschungsdateninfrastruktur und Data Science in der Epidemiologie ist direkt an die wissenschaftliche Direktorin angebunden und bündelt Mitarbeitende aus allen Abteilungen, mit einem Schwerpunkt in der Abteilung für Biometrie und EDV. Das abteilungsübergreifende Zentrum zielt auf zwei Bereiche ab: (A) Forschungsdateninfrastruktur und -management und (B) die methodische Kompetenz im Bereich der Data Science. In jedem Bereich werden wir uns auf zwei Modellprojekte konzentrieren, um den besonderen Anforderungen von Primär- und Sekundärdaten gerecht zu werden.

Im Rahmen des Modellprojekts B1 werden wir eine Forschungsgruppe einrichten, die eine Pooling-Studie zur Bestimmung von Referenzwerten für klinisch relevante Biomarker bei Kindern durchführen wird. Diese Studie wird auf einer bereits veröffentlichten Sonderausgabe des International Journal of Obesity "Filling the gap: international reference values for health care in children" (herausgegeben von Ahrens W, Moreno LA, Pigeot I) aufbauen. Die Forschungsgruppe wird weltweit geeignete Biomarker-Studien identifizieren, ihre Datenqualität bewerten und Kooperationen mit ihnen aufbauen. Die Daten der beteiligten Studien werden anschließend kalibriert und harmonisiert, virtuell gepoolt und mittels föderierter Datenanalysen ausgewertet.

Im Modellprojekt B2 werden wir unter der Leitung des BIPS gemeinsam mit internationalen Partnern eine pharmakoepidemiologische Studie zu neuen Krebstherapeutika durchführen und dabei harmonisierte große europäische Register- und Sekundärdatenquellen nutzen. Wir werden Ansätze nutzen, um Datenquellen mit so genannten gemeinsamen Datenmodellen zu standardisieren und die Daten dann lokal mit standardisierten Skripten zu analysieren, was sich als der praktikabelste Weg erwiesen hat, um internationale pharmakoepidemiologische Studien unter Einhaltung der Datenschutzbestimmungen durchzuführen. Die etablierten Methoden und Kooperationen können auch für andere Projekte genutzt werden und sichern die internationale Wettbewerbsfähigkeit des BIPS in der pharmakoepidemiologischen Forschung.

Förderzeitraum

Beginn:   Januar 2023
Ende:   Dezember 2025

Förderer

  • AV-WGL

Kontaktperson

Prof. Dr. rer. nat. Iris Pigeot