Use of population data bases with double sampling for choice-based sample surveys and time-to-event data (Projekt im DFG-Schwerpunktprogramm "Survey Methodology")

Beschreibung

Zwei-Phasen oder Double-Sampling Methoden wurden in der Epidemiologie für Studien mit fehlender oder unpräziser Kovariableninformation entwickelt. Diese Methoden werden angewendet, wenn für eine große Anzahl Probanden Information zum Ereignisstatus sowie orientierende Information zum Expositionsstatus vorliegen (Phase 1), während komplette Expositions-Information allein für eine stratifizierte Teilstichprobe (Phase 2) erhoben wurde. Die Stratifizierung wird auf Basis der Phase 1 Information gebildet und spielt eine wichtige Rolle bei der gemeinsamen Nutzung beider Datenquellen in der finalen Regressionsanalyse. Ziel des Projekts war die Herleitung empirisch gestützter Regeln für das Design von Zwei-Phasen Studien im Hinblick auf effiziente Nutzung von Phase 1 Information aus großen administrativen Datenbanken.
Basierend auf Abrechnungsdaten einer gesetzlichen Krankenversicherung (Phase 1, n=26.208) und Daten einer Gesundheitsbefragung (Phase 2, n=498) wurde eine Zwei-Phasen Studie zum Einfluss der Einnahme von Phenprocoumon auf das Risiko schwerer Blutungen durchgeführt. Eine Responseanalyse ergab, dass die Teilnahme am Gesundheitssurvey von Geschlecht und Alter abhing. In einem epidemiologischen Kontext sind diese Faktoren oft auch Determinanten des Zielereignisses und müssen daher in die Stratifizierung aufgenommen werden, um die stratumsweise Repräsentativität der Phase 2 Daten zu sichern. Erste Analysen zeigten außerdem, dass sich viele Stratifizierungen zwar dazu eignen, den Parameter von Interesse (Phenprocoumon) unverzerrt und effizient zu schätzen, dass der Effekt bestimmter Kovariablen aber nur mit ausreichender Präzision geschätzt werden kann, wenn die Stratifizierung die jeweilige Kovariable berücksichtigte. Insgesamt wurden für diese Studie 29 verschiedene Stratifizierungen konstruiert, die entweder auf Kreuzklassifikation von einigen wenigen Kovariablen beruhten oder auf Basis eines Scores, z.B. eines Disease-Scores, definiert wurden, der Information einer Vielzahl von Kovariablen einschließt. Da der Vergleich der Stratifizierungen bezüglich Bias und Effizienz der Parameterschätzer keine robusten Ergebnisse lieferte, wurde eine Simulationsstudie durchgeführt, deren Kovariablenverteilung und Umfang der obigen Phase 1 Studie entsprach, wobei jedoch der Umfang der Phase 2 Stichproben (n= 500, 1.000, 2.000, 10.000) variierte. Bei der Suche nach effizienten Stratifizierungen zeigte sich, dass die im Projektantrag formulierte Idee, Perzentile eines auf Phase 1 Variablen basierenden Scores zu nutzen, keinen Vorteil gegenüber einfacheren Verfahren bietet, in denen wenige entscheidende Determinanten des Zielereignisses via Kreuzklassifikation genutzt werden. In der vorliegenden, epidemiologischen Anwendung
ist eine solche Kovariable das Alter: Weil Art und Umfang von Komedikation und Komorbiditäten stark mit Alter assoziiert ist, überträgt eine Stratifizierung nach Alter auch Information über Komedikation und Komorbiditäten aus Phase 1 in die Zwei-Phasen Analyse.

Förderzeitraum

Beginn:   März 2010
Ende:   Februar 2012

Förderer

  • Deutsche Forschungsgemeinschaft (DFG)

Kontaktperson

Prof. Dr. rer. nat. Iris Pigeot

Link

Projektbeschreibung auf der GEPRIS-Homepage der DFG

Ausgewählte Veröffentlichungen zum Projekt

    Zeitschriftenartikel mit peer-review

  • Behr S, Schill W, Pigeot I. Does additional confounder information alter the estimated risk of bleeding associated with phenprocoumon use - Results of a two-phase study. Pharmacoepidemiology and Drug Safety. 2012;21(5):535-545.
    https://doi.org/10.1002/pds.3193
  • Dissertation

  • Behr S. Efficient use of phase 1 information in two-phase case-control studies based in administrative databases. Bremen: Universität Bremen; 2013.
    http://nbn-resolving.de/urn:nbn:de:gbv:46-00103296-17.
  • Vorträge bei wissenschaftlichen Tagungen (eingeladen)

  • Behr S. Two-phase designs in pharmacoepidemiology. International Society for Pharmacoepidemiology (ISPE). 2013 Mid-Year Meeting, 11 April 2013, Munich.
  • Pigeot I, Behr S. Pharmacoepidemiological databases: Strengths, limitations, methodological challenges. 2nd Conference of the Central European Network (CEN), 12-16 September 2011, Zurich, Switzerland.
  • Vorträge bei wissenschaftlichen Tagungen

  • Behr S, Schill W, Pigeot I. Zwei-Phasen Designs zur Berücksichtigung zusätzlicher Confounder-Information in pharmakoepidemiologischen Datenbankstudien. Biometrisches Kolloquium, 13.-15. März 2012, Berlin.
  • Behr S, Schill W, Pigeot I. Design aspects of pharmacoepidemiological two-phase studies. International Conference on Pharmacoepidemiology & Therapeutic Risk Management (ICPE), 22-26 August 2012, Barcelona, Spain.
  • Behr S, Schill W, Pigeot I. Does additional confounder information alter the results of a database study on the risk of bleeding associated with phenprocoumon use? 27th International Conference on Pharmacoepidemiology & Therapeutic Risk Management (ICPE), 14-17 August 2011, Chicago, USA. (Abstract published in: Pharmacoepidemiology & Drug Safety. 2011;20(Suppl.1):254-255)
  • Behr S, Schill W, Pigeot I. Does additional confounder information alter the results of a database study on the risk of bleeding associated with phenprocoumon use? "Biometrie, Epidemiologie und Informatik - Gemeinsam forschen für Gesundheit". 56. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (GMDS) und 6. Jahrestagung der Deutschen Gesellschaft für Epidemiologie (DGEpi), 26.-29. September 2011, Mainz.
  • Schill W, Behr S. Impact of stratification in choice-based sample studies with double sampling. "Advancing Survey Methods", 2. internationale Konferenz des Priority Program Survey Methodology (PPSM), 17-18 November 2011, Bremen.