7. Komplexe Gesundheitsdaten besser nutzen
Wie können wir intelligente Methoden entwickeln, um multidimensionale Daten zu analysieren?
Für unsere Forschung stehen zunehmend mehr Datentypen wie z.B. Geo-, Sensor- oder Sequenzierungsdaten zur Verfügung. Diese gewinnen wir aus verschiedenen Datenquellen wie z.B. Registern, Geodatenbanken oder Forschungsprojekten. Dabei stellen vor allem deren Kombination und deren oft hochdimensionale Struktur neue und komplexe Herausforderungen an das Datenmanagement und die statistische Analyse. In den letzten Jahren wurden daher äußerst leistungsfähige maschinelle Lernverfahren entwickelt, um solche komplexen Daten auszuwerten; auch die datenschutzkonforme Verknüpfung unterschiedlicher Datenquellen für eine verteilte Datenanalyse beginnt sich als eigenes Forschungsgebiet zu etablieren. Für einen erfolgreichen Einsatz in der Epidemiologie werden wir neue Methoden entwickeln, die z.B. verschiedene Datenquellen simultan verarbeiten können und die Interpretation von maschinellen Lernverfahren verbessern. Unser Ziel ist es, diese Methoden effizient für die Analyse großer Datenmengen einzusetzen, um Strukturen aufzudecken, Vorhersagen zu treffen und kausale Schlüsse zu ziehen.