SAS-Makros zur statistischen Analyse von Fall-Kontroll-Studien in einem Zwei-Phasen Design
Zwei-Phasen Methoden (auch bekannt als Double-Sampling Methoden) werden standardmäßig zur Analyse stratifiziert erhobener Daten verwendet (Breslow, 2005): In Phase 1 wird dazu ein Zufallssample aus der Population gezogen, um Kovariablen für die Stratifizierung zu erheben. In Phase 2 werden dann Stichproben unterschiedlicher Größe aus den einzelnen Straten gezogen, um zusätzliche Kovariablen für die gezogenen Studienteilnehmer zu messen. Durch Ziehung von verhältnismäßig vielen Teilnehmern aus den informativsten Straten, z. B. über ein balanciertes Design (siehe Abbildung 1), können Populationsparameter effizienter geschätzt werden. In einer zwei-phasigen Fall-Kontroll-Studie hängen die Straten vom Fall-Kontroll-Status ab. Üblicherweise wird hier für die Phase 2 ein großer Anteil der inzidenten Krankheitsfälle und ein wesentlich geringer Anteil der gesunden Kontrollen gezogen, um die Assoziation zwischen den Risikofaktoren und dem Ereignis zu ermitteln. Die folgenden drei Beispiele illustrieren Anwendungsfelder für zwei-phasige Fall-Kontroll-Studien: Um die Assoziation zwischen einer seltenen Exposition und einer seltenen Krankheit zu ermitteln, wird eine zwei-phasige Studie empfohlen, in der die Stratifizierung basierend auf Expositions- und Krankheitsstatus erfolgt (White, 1982). Ein weiteres Beispiel ist die Untersuchung von Gen-Umwelt-Interaktionen (Andrieu und Goldstein, 1998), wobei die Effizienz der Schätzer dadurch erhöht wird, dass teure Genotypisierung nur für eine nach Krankheit, Familiengeschichte oder seltener Umweltexposition stratifizierte Stichprobe durchgeführt wird. Ein drittes Beispiel ist die Validierungsstudie. Hierbei werden Teilstichproben der Fälle und Kontrollen gezogen, um fehlerfreie Messungen durchzuführen, sodass die Parameterschätzungen für die Verzerrung durch Messfehler adjustiert werden können (Breslow und Holubkov, 1997).
Wir bieten hier ein SAS-Makro-Paket für die statistische Analyse von Fall-Kontroll-Studien im zwei-phasigen Design an (Schill et al., 2014), welches diverse Methoden zur Parameterschätzung beinhaltet. Zusätzlich stellen wir SAS-Makros zur Berechnung von Attributivrisiken und automatisierten Kovariablenselektion bereit. Als Erweiterung bieten wir ein SAS-Makro an, dass zwei-phasige Fall-Kontroll-Studien auch ohne stratifiziertes Sampling-Design durchführen kann (Scott und Wild, 2011). Allerdings wird dann ein parametrisches Modell für die Teilnahme an Phase 2 vorausgesetzt. Alle SAS-Makros benötigen mindestens SAS/STAT 9.22 und SAS/IML 9.2.
Literatur
- Andrieu N, Goldstein AM. Epidemiologic and genetic approaches in the study of gene-environment interaction: an overview of available methods. Epidemiologic Reviews. 1998;20(2):137-147.
- Breslow NE. Case-control study, two-phase. In: Armitage P, Colton T, editors. Encyclopedia of Biostatistics. 2nd edition. Chichester, West Sussex, England, Hoboke, NJ: John Wiley & Sons. 2005
- Breslow NE, Holubkov R. Maximum likelihood estimation of logistic regression parameters under two-phase, outcome-dependent sampling. Journal of the Royal Statistical Society, Series B. 1997;59(2):447-461.
- Schill W, Enders D, Drescher K. A SAS package for logistic two-phase studies. Journal of Statistical Software. 2014;57(9):1-13.
- Scott A, and Wild C. Fitting regression models with response-biased samples. The Canadian Journal of Statistics. 2011;39(3):519-536.
- White JE. A two stage design for the study of the relationship between a rare exposure and a rare disease. American Journal of Epidemiology. 1982;115(1):119-128.