STB: Abteilungsübergreifendes Zentrum A: Forschungsdateninfrastruktur

Beschreibung

Hochwertige Forschungsdaten sind für die epidemiologische Forschung unerlässlich. Im Allgemeinen ist es allerdings nicht möglich, das Potenzial der Forschungsdaten, die in einzelnen Forschungsprojekten erzeugt werden, voll auszuschöpfen, da diese in der Regel einen engen Fokus haben und von begrenzter Dauer sind. Diese Daten bieten häufig die Möglichkeit, weitere Fragen zu untersuchen, die zum Zeitpunkt des Projektbeginns noch nicht absehbar waren oder im Rahmen des Einzelprojekts nicht beantwortet werden konnten. Um dieses Potenzial im Sinne einer effizienten Ressourcennutzung voll auszuschöpfen, wird deswegen zunehmend gefordert, Forschungsdaten zu veröffentlichen und sie mit externen Forschenden zu teilen (Data Sharing). Zu diesem Zweck sollten Forschungsdaten nach den sogenannten FAIR-Prinzipien bereitgestellt werden: Nach diesen Grundsätzen sollen Forschungsdaten auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperable) und von Dritten wiederverwendbar (Reusable) sein. Dies bedeutet, dass datenerzeugende Einrichtungen wie das BIPS den Aufwand für die Datenaufbereitung und -dokumentation deutlich erhöhen müssen, um eine sinnvolle Nutzung durch Dritte unter Einhaltung aller rechtlichen und ethischen Anforderungen zu ermöglichen. Gleichzeitig bietet die gemeinsame Nutzung von Daten die Möglichkeit, die eigene Forschung durch die zusätzliche Analyse externer Datenquellen zu erweitern und neue Forschungsfragen durch die Kombination verschiedener externer Datenquellen mit eigenen Daten zu entwickeln.

Das abteilungsübergreifende Zentrum für Forschungsdateninfrastruktur und Data Science in der Epidemiologie ist direkt an die wissenschaftliche Direktorin angebunden und bündelt Mitarbeitende aus allen Abteilungen, mit einem Schwerpunkt in der Abteilung für Biometrie und EDV. Das abteilungsübergreifende Zentrum zielt auf zwei Bereiche ab: (A) Forschungsdateninfrastruktur und -management und (B) die methodische Kompetenz im Bereich der Data Science. In jedem Bereich werden wir uns auf zwei Modellprojekte konzentrieren, um den besonderen Anforderungen von Primär- und Sekundärdaten gerecht zu werden.

Im Modellprojekt A1 sollen die Daten der IDEFICS/I.Family-Kohorte nach den FAIR-Prinzipien aufbereitet werden, um als Prototyp für die Bereitstellung von besonders sensiblen Primärstudiendaten zu dienen. Dazu werden die vorhandenen strukturierten Metadaten um eine detaillierte Dokumentation der Datenherkunft und -qualität erweitert und veröffentlicht, um die Daten für potenzielle externe Forschende besser auffindbar zu machen. Verfahren für den sicheren Datenzugang und die Überwachung der Datennutzung müssen entwickelt und getestet werden. Zusätzlich ist geplant, ein Webportal für interaktive Analysen einzurichten, die vor der Beantragung des Datenzugangs durchgeführt werden können, um die Nützlichkeit dieser Datenquelle für den jeweiligen Studienzweck zu bewerten.

Im Modellprojekt A2 soll GePaRD schrittweise zu einem Forschungsdatenzentrum (FDZ) ausgebaut werden, um diese wichtige Datenquelle auch externen Forschenden zur Verfügung zu stellen. Unter Berücksichtigung der aktuellen gesetzlichen Vorgaben werden am BIPS Arbeitsplätze für Gastwissenschaftler eingerichtet, die diese Daten nutzen. Die Vorbereitung der Räumlichkeiten umfasst die Einrichtung wirksamer Kontrollmaßnahmen und Sicherheitsvorkehrungen. Es werden zusätzliche technische Verfahren eingerichtet, um eine unbefugte Datennutzung zu verhindern.

Förderzeitraum

Beginn:   Januar 2023
Ende:   Dezember 2025

Förderer

  • AV-WGL

Kontaktperson

Prof. Dr. rer. nat. Iris Pigeot