Statistische Modellierung von Kovariablen-variierenden Netzwerken
Beschreibung
- Hochdimensionale Netzwerke spielen eine Schlüsselrolle beim Verständnis komplexer Zusammenhänge. Diese Zusammenhänge sind oft dynamischer Natur und können sich durch verschiedene externe Faktoren wie Zeit oder Krankheitsstatus ändern. Bestehende Methoden zur Schätzung hochdimensionaler grafischer Modelle sind oft auf statische Graphen beschränkt oder auf solche, die sich mit einer einzigen Kovariate ändern können. In diesem Projekt wurde eine neuartige Modellklasse namens Covariate-varying networks (CVNs) entwickelt, die sich in Abhängigkeit von mehreren externen Kovariaten ändern kann. Die Schätzmethode kontrolliert Spärlichkeit, indem ein L_1-Strafterm auf die zu schätzenden Präzisionsmatrizen von m >= 2 Graphen angewendet wird. Diese m Graphen weisen zudem oft einen Ähnlichkeitsgrad auf, der als Glätte bezeichnet wird. Dies wird durch einen Metagraphen mit m Knoten repräsentiert, von denen jeder einem zu schätzenden Graphen entspricht. Die (gewichtete) Adjazenzmatrix des Metagraphen stellt die Stärke der Ähnlichkeit dar, die zwischen den m Graphen erzwungen wird. Das daraus bei der Schätzung resultierende Optimierungsproblem wird mithilfe einer alternierenden Richtungsmethode von Multiplikatoren (ADMM) gelöst. Ein wesentlicher Schritt innerhalb der ADMM besteht darin, einen gewichteten fusionierten Signalapproximator (wFLSA) zu lösen, was ein bislang unerforschtes Problem war. Dafür wird ein generalisiertes LASSO-Problem neu formuliert und mit einer ADMM gelöst, die explizit auf diese Aufgabe zugeschnitten wird. Die wFLSA-Methode hat auch wertvolle andere Anwendungen, wie z.B. in der Bildglättung und der Erkennung von Wechselpunkten in Zeitreihen. Beide Methoden, CVN und wFLSA, wurden in R implementiert und als R-Pakete veröffentlicht, um eine breite Nutzung und Anwendung zu ermöglichen. Da die CVN-Modellschätzung die Auswahl von Regularisierungsparametern erfordert, haben wir in Simulationsstudien geeignete Methoden dafür untersucht. Die Ergebnisse zeigen, dass aktuelle Methoden, einschließlich StARS (Stability Approach to Regularization Selection), oft unzufriedenstellend abschneiden, was den Bedarf an weiterer Forschung unterstreicht. Darüber hinaus wurde die Performanz von LASSO-ähnlichen Selektionsverfahren im Vergleich mit 'Best Subset' Selektion untersucht. Hier zeigte sich, dass penalisierten Selektionsverfahren insbesondere bei bei korrelierten Variablen oder niedrigem Signal-Rausch-Verhältnis, besser abschneiden.
Förderzeitraum
- Beginn: September 2020
Ende: Juli 2024
Förderer
- Deutsche Forschungsgemeinschaft (DFG)