Statistische Modellierung von Kovariablen-variierenden Netzwerken
Beschreibung
- Für die Beschreibung und das Verständnis komplexer Systeme sind statistische Methoden zur Netzwerkanalyse unverzichtbar. In der molekularen und genetischen Epidemiologie werden solche Methoden z.B. zur Untersuchung von Interaktionen zwischen molekularen Regulatoren und Genexpressionsniveaus verwendet. Dabei sind die interessierenden Abhängigkeitsstrukturen oft nicht statisch. Dementsprechend zielen neuere statistische Ansätze auf eine Zeit-dynamische Netzwerkanalyse ab. Allerdings wurde dabei bisher vernachlässigt, dass die Struktur komplexer Systeme häufig erheblich von anderen, nicht zeitlichen Faktoren abhängt. Zum Beispiel kann eine UV-Strahlung das für die DNA-Reparatur verantwortliche Gennetzwerk schädigen. Zusammen mit weiteren externen Kovariaten führt dies möglicherweise zu einer Funktionsstörung und somit zu einer Erhöhung des Hautkrebsrisikos. Das Wissen, ob und wie sich Netzwerke durch potentiell modifizierbare Kovariaten ändern, ist somit z.B. für die Identifikation von Ansatzpunkten zur Prävention von Erkrankungen ausschlaggebend.
Um solche Einflüsse und Zusammenhänge untersuchen zu können, wird in diesem Projekt ein neuer statistischer Ansatz verfolgt, der aus einer Modellklasse und entsprechenden innovativen Methoden zur Modellanpassung besteht. Basierend auf der Theorie grafischer Modelle und mithilfe individueller Beobachtungsdaten werden Netzwerkverläufe als Funktion von Kovariaten modelliert. Die resultierende neue Modellklasse der „Kovariaten-variierenden Netzwerke“ (CVNs) wird dabei allgemein formuliert, so dass Zusammenhänge mit mehreren diskreten und kontinuierlichen Kovariaten gemeinsam abgebildet werden können und somit auch bei komplexen Netzwerkstrukturen die individuelle Heterogenität bzgl. dieser Kovariaten berücksichtigt wird. Die neuen Methoden werden u.a. auf bedingten Kovarianzen basieren und die Anpassung von CVNs auch in hochdimensionalen Situationen erlauben. Um die wichtigsten Einflüsse auf die Netzwerkstruktur nachzuweisen, werden Glättungsverfahren mit Regularisierungsansätzen kombiniert. Der Glättungsaspekt stellt sicher, dass nur relevante Strukturveränderungen modelliert werden; die Regularisierung dagegen gewährleistet, dass nur Kovariaten mit deutlichem Einfluss auf die Struktur ausgewählt werden. Zudem wird die Modellanpassung erlauben, dass verfügbares Vorwissen über ein Netzwerk (z.B. aus Online-Datenbanken) berücksichtigt werden kann. Die Modellanpassung ist mit einem anspruchsvollen Optimierungsproblem verbunden und erfordert die Entwicklung effizienter Algorithmen. Es werden die theoretischen asymptotischen Eigenschaften des Ansatzes hergeleitet sowie in Simulationsstudien deren Performanz zur Modellwahl beurteilt. Machbarkeit und Interpretierbarkeit werden mit realen Daten untersucht.
Förderzeitraum
- Beginn: September 2020
Ende: Juli 2024
Förderer
- Deutsche Forschungsgemeinschaft (DFG)