Erreurs de type I et de type II
Les erreurs de type I et de type II sont les deux manières par lesquelles un test d'hypothèse peut aboutir à une conclusion erronée. Une erreur de type I est un faux positif – le rejet d'une hypothèse nule vraie et l'affirmation d'un effet qui n'existe pas – tandis qu'une erreur de type II est un faux négatif – l'incapacité à détecter un effet réel. Le niveau de signification contrôle le taux d'erreurs de type I, et le complément du taux d'erreurs de type II est la puissance statistique ; ainsi, ces deux types d'erreurs définissent la manière dont la conception d'une étude équilibre les risques d'affirmations excessives ou insuffisantes.
Definition
Une erreur de type I est le rejet d'une hypothèse nule qui est en réalité vraie (un faux positif), survenant avec une probabilité alpha ; une erreur de type II est l'incapacité à rejeter une hypothèse nule qui est en réalité fausse (un faux négatif), survenant avec une probabilité bêta.
Scope
Ce sujet définit les deux types d'erreurs, les relie au niveau de signification (alpha) et au taux d'erreurs de type II (bêta), et explique le compromis entre eux dans la conception des études. Il s'agit d'une méthodologie de référence pour l'évaluation et la planification des études, et non d'une règle de décision clinique.
Core questions
- Que signifie aboutir à une conclusion faux positif par rapport à une conclusion faux négatif ?
- Comment le niveau de signification et le taux d'erreurs de type II sont-ils liés à ces erreurs ?
- Pourquoi la réduction d'un taux d'erreur peut-elle augmenter l'autre ?
- Comment la taille de l'échantillon influence-t-elle la probabilité de chaque erreur ?
Key concepts
- Erreur de type I (faux positif)
- Erreur de type II (faux négatif)
- Niveau de signification (alpha)
- Taux d'erreurs de type II (bêta)
- Puissance comme 1 moins bêta
- Compromis entre les erreurs
- Tests multiples et faux positifs gonflés
Mechanisms
Dans le cadre de Neyman-Pearson, un test est conçu en fixant à l'avance le taux d'erreurs de type I tolérable (alpha, le niveau de signification), ce qui détermine la fréquence à laquelle une hypothèse nule vraie sera rejetée à tort. Le taux d'erreurs de type II (bêta) représente la probabilité de ne pas détecter un effet réel d'une taille donnée, et un moins bêta correspond à la puissance du test. Pour une taille d'échantillon fixe, les deux taux d'erreurs sont en compromis : rendre le test plus strict pour réduire les faux positifs augmente la probabilité de faux négatifs, et inversement. L'augmentation de la taille de l'échantillon est le principal moyen de réduire les deux simultanément. Tester de nombreuses hypothèses sans ajustement gonfle le taux global d'erreurs de type I, c'est pourquoi la multiplicité est une préoccupation récurrente en matière de conception.
Clinical relevance
Ces types d'erreurs expliquent comment les conclusions des essais et des études observationnelles peuvent induire en erreur : un résultat faux positif peut promouvoir une intervention inefficace, tandis qu'un résultat faux négatif peut écarter une intervention utile. Examiner si une étude a contrôlé ses taux d'erreurs – et si un résultat nul reflète simplement une faible puissance – est essentiel pour l'évaluation des preuves. Cette entrée explique les erreurs inférentielles et ne constitue pas une base pour des décisions cliniques individuelles.
Evidence & guidelines
Les commentaires méthodologiques soulignent qu'un résultat non significatif ne constitue pas une preuve d'absence d'effet, étant donné que les études sous-dimensionnées rendent les erreurs de type II probables ; la remarque d'Altman et Bland selon laquelle l'absence de preuve n'est pas une preuve d'absence le traduit directement. Des revues de recherches sous-dimensionnées, telles que l'analyse de Button et de ses collègues en neurosciences, documentent comment une faible puissance gonfle à la fois les faux négatifs et réduit la fiabilité des résultats significatifs.
History
La distinction entre les erreurs de première et de seconde espèce a été introduite par Neyman et Pearson dans leur formalisation de 1933 du test d'hypothèse, qui a conçu la planification des tests comme le contrôle de ces deux probabilités d'erreur. Les conséquences pratiques – en particulier les dangers de l'erreur de type II dans les petites études – sont devenues un thème récurrent dans les critiques méthodologiques de la recherche en santé et comportementale aux XXe et XXIe siècles.
Debates
- Interprétation des résultats non significatifs
- Étant donné que les études sous-dimensionnées commettent fréquemment des erreurs de type II, un résultat non significatif est souvent mal interprété comme démontrant l'absence d'effet ; les méthodologistes soulignent que l'absence de preuve n'est pas une preuve d'absence.
Key figures
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- J. Martin Bland
- John P. A. Ioannidis
Related topics
Seminal works
- neyman-pearson-1933
- altman-bland-1995
Frequently asked questions
- Quelle est la différence entre une erreur de type I et une erreur de type II ?
- Une erreur de type I est un faux positif – conclure à l'existence d'un effet alors qu'il n'y en a pas – et une erreur de type II est un faux négatif – ne pas détecter un effet réel. Leurs probabilités sont respectivement appelées alpha et bêta.
- Pourquoi ne puis-je pas simplement rendre les deux taux d'erreurs aussi faibles que possible ?
- Pour une taille d'échantillon fixe, les deux sont en compromis : rendre le test plus strict pour réduire les faux positifs augmente les faux négatifs. Le principal moyen de réduire les deux simultanément est d'augmenter la taille de l'échantillon.