Analyse de survie et méthodes d'analyse des temps d'événements
L'analyse de survie est la branche des statistiques qui s'intéresse au temps écoulé jusqu'à la survenue d'un événement d'intérêt — décès, récidive, guérison, défaillance d'un dispositif, ou tout autre critère d'évaluation clairement défini. Sa particularité est que, pour certains sujets, l'événement n'est pas survenu à la fin de la période d'observation, de sorte que leurs temps d'événement ne sont que partiellement connus (censurés). Ce domaine développe des méthodes qui utilisent correctement cette information incomplète plutôt que de la rejeter.
Definition
L'analyse de survie comprend des méthodes statistiques pour analyser la durée attendue jusqu'à la survenue d'un ou plusieurs événements, en tenant compte des observations censurées pour lesquelles le temps d'événement n'est connu que pour dépasser (ou se situer dans) un certain intervalle.
Scope
Ce domaine oriente le lecteur vers les concepts fondamentaux qui unifient les méthodes d'analyse des temps d'événements : les fonctions de survie et de risque (hazard), la censure et le suivi, l'estimation non paramétrique des courbes de survie, la comparaison de groupes, et la modélisation de régression du risque. Il renvoie aux sujets détaillés — données de censure et de suivi, courbes de Kaplan-Meier, l'hypothèse des risques proportionnels, régression de Cox, et les risques concurrents — et les traite comme un matériel de référence méthodologique plutôt que comme des recommandations cliniques.
Sub-topics
Core questions
- Combien de temps s'écoule-t-il avant qu'un événement d'intérêt ne se produise, et comment cette distribution est-elle décrite par les fonctions de survie et de risque ?
- Comment les observations censurées peuvent-elles apporter des informations sans biaiser l'analyse ?
- Comment les courbes de survie sont-elles estimées et comparées entre les groupes ?
- Comment l'effet des covariables sur le taux d'événements est-il modélisé, et quelles hypothèses cette modélisation requiert-elle ?
- Qu'est-ce qui change lorsque plus d'un type d'événement peut survenir (risques concurrents) ?
Key concepts
- Fonction de survie S(t)
- Fonction de risque (hazard) et risque cumulé
- Censure et troncature
- Ensemble à risque (risk set)
- Estimation non paramétrique (Kaplan-Meier)
- Comparaison par test du log-rank
- Régression des risques proportionnels
- Risques concurrents et incidence cumulative
Mechanisms
Les données de temps d'événements sont décrites par la fonction de survie S(t), la probabilité de rester sans événement au-delà du temps t, et, de manière équivalente, par la fonction de risque (hazard), le taux instantané de l'événement parmi ceux qui sont encore à risque. Étant donné que le suivi est fini et que les sujets entrent et sortent de l'observation à des moments différents, les données sont généralement censurées à droite : le temps d'événement d'un sujet n'est connu que pour dépasser son dernier temps d'observation. Des méthodes telles que l'estimateur de Kaplan-Meier et le modèle de risques proportionnels de Cox sont construites sur l'ensemble à risque (risk set) — les sujets sous observation et sans événement juste avant chaque temps d'événement — de sorte que chaque événement ne contribue qu'avec l'information réellement disponible. Ce traitement du suivi censuré et variant dans le temps est ce qui distingue l'analyse de survie de la régression ordinaire d'un résultat continu (Clark et al., 2003; Leung et al., 1997).
Clinical relevance
Les méthodes d'analyse des temps d'événements sous-tendent la plupart des rapports sur le pronostic et l'effet du traitement dans la recherche clinique, y compris les courbes de survie, les rapports de risque (hazard ratios) et la survie médiane. Les comprendre permet une évaluation critique de la manière dont ces preuves sont générées ; ce domaine est descriptif des méthodes analytiques et n'est pas une source de recommandations diagnostiques ou thérapeutiques.
Epidemiology
Les méthodes de survie sont omniprésentes en oncologie, cardiologie, maladies infectieuses, transplantation et dans les études de cohorte en santé publique, partout où le moment de la survenue d'un événement — et pas seulement sa survenue — est informatif. Leur adoption s'est rapidement développée après que l'estimateur de Kaplan-Meier (1958) et la régression de Cox (1972) ont fourni des outils pratiques pour les données censurées.
Evidence & guidelines
Il n'existe pas de lignes directrices de pratique clinique pour l'analyse de survie elle-même ; les normes de référence méthodologiques sont des articles statistiques fondamentaux et des manuels de biostatistique. L'estimateur de Kaplan-Meier (Kaplan & Meier, 1958) et le modèle de risques proportionnels de Cox (Cox, 1972) sont les méthodes fondamentales, des tutoriels et des manuels (Clark et al., 2003; Collett, 2015; Putter et al., 2007) consolidant la pratique pour la recherche médicale.
History
Les méthodes actuarielles de tables de mortalité (life-table methods) précèdent ce domaine de plusieurs siècles, mais l'analyse de survie moderne a pris forme au milieu du XXe siècle. L'estimateur produit-limite de Kaplan et Meier de 1958 a fourni une courbe de survie non paramétrique rigoureuse pour les données censurées ; la famille des tests du log-rank a suivi pour la comparaison de groupes ; et le modèle de risques proportionnels de Cox de 1972 a introduit la régression ajustée par covariables pour les résultats de temps d'événements sans spécifier le risque de base (baseline hazard). Des travaux ultérieurs sur les risques concurrents et les modèles multi-états ont étendu le cadre à des contextes avec plusieurs types d'événements (Putter et al., 2007).
Key figures
- Edward L. Kaplan
- Paul Meier
- David R. Cox
- Nathan Mantel
Related topics
Seminal works
- kaplan-meier-1958
- cox-1972
Frequently asked questions
- En quoi l'analyse de survie diffère-t-elle de la régression ordinaire ?
- Elle modélise le temps jusqu'à un événement tout en gérant correctement les observations censurées, où l'événement n'est pas encore survenu à la fin de l'observation ; une telle information partielle ne peut pas être prise en compte par la régression standard d'un résultat continu.
- Quelles sont les deux fonctions qui décrivent les données de temps d'événements ?
- La fonction de survie S(t), la probabilité de rester sans événement au-delà du temps t, et la fonction de risque (hazard), le taux instantané d'événement parmi ceux qui sont encore à risque ; l'une détermine entièrement l'autre.