TP — Inférence causale en épidémiologie

G-computation, IPTW et IPCW — application pas-à-pas.
Auteur·rice

David Hajage

Introduction

Bienvenue dans ce TP sur l’inférence causale en épidémiologie !

Scénario

Nous disposons d’une étude de cohorte observationnelle dont l’objectif est d’évaluer l’effet d’une exposition \(A\) (par exemple un traitement médical) sur la survie à 3 ans.

Les patients sont suivis pendant 3 ans avec des visites annuelles. À chaque visite, leur statut d’exposition peut changer : un patient initialement exposé peut arrêter, et inversement. Un facteur de confusion \(L\), dépendant du temps, est mesuré à chaque visite. Une covariable initiale \(X\) est également disponible.

Deux questions causales

Ce TP vous guidera pour répondre à deux questions causales distinctes :

NoteQuestion 1 — Effet de l’exposition initiale (analogue-ITT)

Quelle serait la survie si tout le monde avait été exposé dès le début de l’étude (\(A_0 = 1\)), et quelle serait la survie si personne ne l’avait été (\(A_0 = 0\)) ?

Cette question porte sur l’initiation de l’exposition au temps 0, indépendamment de ce qui se passe ensuite (les patients peuvent arrêter ou débuter le traitement par la suite).

→ Abordée en Parties 1 et 2 (G-computation puis IPTW)

NoteQuestion 2 — Effet de l’exposition maintenue (analogue per-protocol)

Quelle serait la survie si tout le monde avait été exposé et l’était resté tout au long du suivi (\(\bar{a} = 1\)), et si personne n’avait jamais été exposé (\(\bar{a} = 0\)) ?

Cette question porte sur le maintien de l’exposition tout au long du suivi. Elle nécessite de traiter les déviations de traitement comme une forme de censure.

→ Abordée en Partie 3 (IPTW + IPCW)

Structure du TP

Partie Méthode Question Durée estimée
Présentation Analyse brute (Kaplan-Meier) Description ~10 min
Partie 1 G-computation Q1 — effet de l’exposition initiale ~20 min
Partie 2 IPTW Q1 — même objectif, approche différente ~25 min
Partie 3 IPTW + IPCW Q2 — effet de l’exposition maintenue ~30 min
Conclusion Comparaison des résultats Synthèse ~5 min

Les durées annoncées sont approximatives, vous pourrez terminer chez vous ce que vous n’auriez pas eu le temps de faire aujourd’hui. Vous pouvez télécharger le pdf de ce TP via le lien tout en bas de cette page.

Comment utiliser ce TP

Les exercices utilisent WebR : le code R s’exécute directement dans votre navigateur, sans installation.

  • Chaque bloc de code peut être modifié et exécuté avec le bouton Run Code
  • Les solutions sont là pour être consultées librement et sans hésitation. L’objectif de ce TP n’est pas de retrouver le code depuis une page blanche, mais de suivre et comprendre chaque étape : lisez-les comme un exemple commenté, exécutez-les, modifiez-les. Certaines analyses mobilisent des compétences R avancées — c’est normal de s’appuyer sur les solutions.
  • Les variables créées sur une page ne sont pas disponibles sur les pages suivantes ; elles sont reconstruites automatiquement dans chaque section (voir Note sur la session R au début de chaque partie).

Pour commencer, cliquez sur Présentation des données dans le menu à gauche.


⬇ Télécharger la version PDF du TP (avec les corrections) ⬇ Télécharger les données df.csv