Einzelansicht

Kausale Modellselektion für Kohortendaten

Beschreibung

In diesem Projekt werden wir Methoden der kausalen Modellselektion (Causal Discovery) für die Analyse von Kohortendaten entwickeln. Kohortenstudien sind in der epidemiologischen oder soziologischen Erforschung von Lebensabläufen eine wichtige Informationsquelle, u.a. um späte Folgen einer Exposition in jungen Jahren abzuschätzen. Methoden des Causal Discovery befinden sich an der Schnittstelle zwischen Informatik und Statistik. Dabei wird der Datensatz unter Ausnutzung spezieller Annahmen statistisch dahin gehend ausgewertet, dass idealerweise alle kausalen Zusammenhänge zwischen den Variablen einem Graph zu entnehmen sind. Obwohl Causal Discovery Methoden momentan vor allem im „Big Data“ Kontext vermehrt eingesetzt werden, gibt es bisher keine entsprechenden Verfahren, die speziell auf Kohortendaten ausgerichtet oder direkt dafür geeignet sind. Dieses DFG-Projekt wird diese Lücke durch die Bearbeitung der folgenden Arbeitspakete schließen:
  • (1) Die Formulierung und Untersuchung einer neue Modellklasse der kausalen Kohortengraphen (CCGs), sowie die Entwicklung dafür geeigneter und effizienter Modellselektionsverfahren.
  • (2) Die Entwicklung neuer statistischer Ansätze zur kausalen Modellselektion, welche die speziellen Probleme mit Kohortendaten lösen, vor allem Methoden für fehlende Werte.
  • (3) Das Erstellen eines Leitfadens zur praktischen Anwendung (inkl. Empfehlungen und Warnungen) sowie die Programmierung einer bedienungsfreundlichen Software, damit die neuen Methoden eine weit verbreitete Anwendung finden kann.

Das Vorhaben ist vor allem deshalb vielversprechend, weil Causal Discovery für Kohortendaten einen fundamental anderen Ansatz verfolgt als die üblichen statistischen Verfahren. Es eröffnet sich so die Möglichkeit, gänzlich neue Grundlagenerkenntnisse zu gewinnen, die z.B. für neue Ansätze in zukünftigen Interventionsstudien genutzt werden können. Letztlich werden unsere Ergebnisse dadurch einen vielversprechenden Beitrag zur öffentlichen Gesundheitsversorgung und zur medizinischen Entscheidungsfindung leisten.

Förderzeitraum

Beginn:   Januar 2018
Ende:   Dezember 2020

Förderer

  • Deutsche Forschungsgemeinschaft (DFG)

Kontaktperson

Prof. Dr. rer. nat. Vanessa Didelez

Kooperationspartner

  • Prof Marloes Maathuis (Department of Mathematics, ETH Zürich, Schweiz)
  • Prof Peter Spirtes (Department of Philosophy, Carnegie Mellon University, Pittsburgh, PA, USA)
  • Prof Stijn Vansteelandt (Department of Appl. Mathematics, Computer Science and Statistics, University of Ghent, Belgium)

Ausgewählte Veröffentlichungen zum Projekt

    Zeitschriftenartikel mit peer-review

  • Witte J, Didelez V. Covariate selection strategies for causal inference: Classification and comparison. Biometrical Journal. 2019;61(5):1270-1289.
    http://dx.doi.org/10.1002/bimj.201700294
  • Poster bei wissenschaftlichen Tagungen

  • Witte J, Didelez V. Exploring the causal structure in cohort data using generalized IDA. Rostock Retreat on Causality, 2-4 July 2018, Rostock.
  • Witte J, Didelez V. Exploring the causal structure in cohort data using generalized IDA. Bocconi Summer School in Advanced Statistics and Probability, 9-20 July 2018, Como, Italy.