Tests du Chi-deux et exact de Fisher
Le test du chi-deux et le test exact de Fisher sont les deux procédures standard pour déterminer si deux variables catégorielles dans un tableau de contingence sont associées ou indépendantes. Le test du chi-deux compare les effectifs observés des cellules avec ceux attendus sous l'hypothèse d'indépendance en utilisant une approximation pour grands échantillons, tandis que le test exact de Fisher calcule directement la probabilité du tableau observé et est utilisé lorsque les effectifs sont faibles.
Definition
Le test du chi-deux d'association mesure l'écart entre les effectifs observés et attendus des cellules sous l'hypothèse nulle d'indépendance, en référant la statistique résultante à une distribution du chi-deux; le test exact de Fisher calcule plutôt, à partir de la distribution hypergéométrique avec les marges fixées, la probabilité exacte des tableaux aussi ou plus extrêmes que celui observé.
Scope
Cette entrée aborde la statistique du chi-deux de Pearson et ses degrés de liberté, la condition sur les effectifs attendus qui justifie l'approximation du chi-deux, la correction de continuité (de Yates), la logique du test exact de Fisher basée sur la distribution hypergéométrique, et la question pratique de savoir quand un test exact devrait remplacer l'approximation. Elle les présente comme des tests d'association, et non comme des directives cliniques, et souligne qu'ils évaluent l'existence d'une association, et non son ampleur.
Core questions
- Les deux variables catégorielles de ce tableau sont-elles indépendantes, ou y a-t-il des preuves d'association ?
- Comment la statistique du chi-deux est-elle formée à partir des effectifs observés et attendus, et combien de degrés de liberté possède-t-elle ?
- Quand les effectifs attendus sont-ils trop faibles pour que l'approximation du chi-deux soit fiable ?
- Comment le test exact de Fisher évite-t-il l'approximation pour grands échantillons, et que signifie « conditionner sur les marges » ?
Key concepts
- Effectifs observés versus attendus
- Statistique du chi-deux de Pearson
- Degrés de liberté (r-1)(c-1)
- Approximation pour grands échantillons (asymptotique)
- Règle empirique des effectifs attendus
- Correction de continuité de Yates
- Distribution hypergéométrique et marges fixes
- Valeurs p exactes versus asymptotiques
Mechanisms
Sous l'hypothèse d'indépendance, l'effectif attendu de chaque cellule est le total de sa ligne multiplié par le total de sa colonne, divisé par le total général. La statistique du chi-deux de Pearson somme la différence au carré entre les effectifs observés et attendus, divisée par l'effectif attendu, pour toutes les cellules; pour un tableau r×c, cette statistique est comparée à une distribution du chi-deux avec (r−1)(c−1) degrés de liberté, le résultat sur les degrés de liberté que Fisher a clarifié en 1922. L'approximation se dégrade lorsque les effectifs attendus sont faibles, ce qui a conduit à une directive courante selon laquelle les effectifs attendus devraient généralement dépasser environ cinq; la correction de continuité de Yates a été proposée pour améliorer l'approximation pour les tableaux 2×2. Le test exact de Fisher contourne l'approximation en traitant les marges des lignes et des colonnes comme fixes et en calculant, à partir de la distribution hypergéométrique, la probabilité exacte du tableau observé et de chaque tableau plus extrême, en les additionnant pour obtenir une valeur p. Parce qu'il est exact, il est préféré pour les tableaux creux (sparse tables), bien que des revues soulignent sa nature conditionnelle et conservatrice et recommandent des choix spécifiques parmi les tests disponibles.
Clinical relevance
Le fait qu'une étude rapporte qu'une exposition est ou non associée à un résultat repose souvent sur l'un de ces tests, donc comprendre leur fonctionnement — et qu'une petite valeur p signale une association mais ne dit rien sur son ampleur — fait partie de l'évaluation de la recherche en santé. Ces tests sont des outils pour évaluer les preuves d'association et ne constituent pas une base pour les décisions individuelles de diagnostic ou de traitement.
Epidemiology
Les tests du chi-deux et exact de Fisher sont les tests de signification par défaut pour les tableaux de contingence 2×2 et plus grands en épidémiologie et en recherche clinique, accompagnant les rapports de risques (risk ratios) et les rapports de cotes (odds ratios) qui quantifient les mêmes associations. Le test exact est couramment utilisé pour les petits échantillons ou les événements rares où l'approximation du chi-deux n'est pas fiable.
History
Karl Pearson a introduit la statistique du chi-deux d'ajustement (goodness-of-fit) en 1900; l'article de Fisher de 1922 a corrigé les degrés de liberté pour les tableaux de contingence, et Fisher a ensuite conçu le test exact portant son nom pour les petits échantillons. Yates a proposé sa correction de continuité pour les tableaux 2×2 en 1934. La recommandation moderne parmi ces procédures et celles qui y sont liées a été synthétisée dans des revues méthodologiques et des manuels.
Debates
- Tests exacts versus asymptotiques pour les petits tableaux 2×2
- Le test exact de Fisher conditionne sur les deux marges et est exact mais tend à être conservateur, tandis que le chi-deux non corrigé peut être anti-conservateur pour les petits échantillons et la correction de Yates sur-corrige; les revues donnent donc des recommandations nuancées plutôt qu'une règle unique.
Key figures
- Karl Pearson
- Ronald A. Fisher
- Frank Yates
- Alan Agresti
Related topics
Seminal works
- pearson-1900
- fisher-1922
- lydersen-2009
Frequently asked questions
- Quand le test exact de Fisher devrait-il être utilisé à la place du test du chi-deux ?
- Lorsque le tableau est petit ou creux (sparse) — typiquement lorsqu'un ou plusieurs effectifs attendus des cellules sont faibles — l'approximation du chi-deux pour grands échantillons peut être peu fiable, et le test exact de Fisher, qui calcule une probabilité exacte, est préféré.
- Un test du chi-deux significatif m'indique-t-il l'intensité de l'association ?
- Non. Ces tests indiquent s'il existe des preuves d'une association ; l'ampleur de l'association est transmise par une mesure d'effet distincte telle qu'un rapport de risques (risk ratio) ou un rapport de cotes (odds ratio), qui devrait être rapportée en même temps que la valeur p.