ScholarGate
Assistant

Puissance statistique et taille de l'échantillon

La puissance statistique est la probabilité qu'une étude détecte un effet d'une taille donnée lorsque cet effet existe réellement — formellement, un moins le taux d'erreur de type II. La détermination de la taille de l'échantillon est l'étape de planification qui consiste à choisir le nombre de participants nécessaires pour atteindre une puissance cible, compte tenu de la taille d'effet attendue, du niveau de signification choisi et de la variabilité des données. Ensemble, ces concepts permettent de déterminer si une étude est suffisamment vaste pour donner à sa question une chance équitable d'obtenir une réponse.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

La puissance statistique est la probabilité qu'un test rejette correctement une fausse hypothèse nule (détecte un effet réel d'une taille spécifiée) ; la détermination de la taille de l'échantillon est le calcul du nombre d'observations nécessaires pour atteindre une puissance cible à un niveau de signification donné pour une taille d'effet et une variabilité supposées.

Scope

Ce sujet explique ce que signifie la puissance, les quatre quantités interdépendantes d'un calcul de puissance (taille d'effet, niveau de signification, puissance et taille de l'échantillon), et les conséquences d'une recherche sous-puissante. Il est présenté comme une méthodologie de référence pour la planification et l'évaluation des études, et non comme une règle de décision clinique.

Core questions

  • Quelle est la probabilité que l'étude détecte l'effet qu'elle recherche ?
  • Combien de participants sont nécessaires pour atteindre une puissance cible ?
  • Comment la taille d'effet, la variabilité et le niveau de signification influencent-ils la taille de l'échantillon ?
  • Qu'est-ce qui ne va pas lorsqu'une étude est sous-puissante ?

Key concepts

  • Puissance statistique (1 moins bêta)
  • Taille d'effet
  • Niveau de signification (alpha)
  • Variabilité et écart-type
  • Calcul a priori de la taille de l'échantillon
  • Étude sous-puissante
  • Différence minimale cliniquement importante

Mechanisms

La puissance, le niveau de signification, la taille d'effet et la taille de l'échantillon sont liés de telle sorte que la fixation de trois de ces éléments détermine le quatrième. Pour un niveau de signification donné, la puissance augmente à mesure que la taille de l'effet réel croît, que la variabilité diminue et que la taille de l'échantillon augmente. Le calcul de la taille de l'échantillon inverse cette relation : en partant d'une taille d'effet supposée (souvent un minimum qu'il est pertinent de détecter), d'un niveau de signification choisi et d'une puissance cible — généralement 80 % ou 90 % — il détermine le nombre d'observations nécessaires. Une sous-puissance (underpowering) non seulement augmente le risque de manquer des effets réels (erreur de type II), mais rend également toute découverte significative plus susceptible d'être exagérée ou fausse, car seules des estimations importantes, potentiellement gonflées, franchissent le seuil dans une petite étude.

Clinical relevance

Le fait qu'un essai ou une étude ait été adéquatement puissant influence la manière dont ses résultats doivent être interprétés : un résultat non significatif issu d'une étude sous-puissante est largement non informatif plutôt que rassurant, et la justification prospective de la taille de l'échantillon est un élément attendu de la publication des études. Cette entrée décrit le raisonnement de la puissance et de la taille de l'échantillon à des fins d'évaluation et de conception et ne constitue pas une base pour des décisions diagnostiques ou thérapeutiques individuelles.

Evidence & guidelines

Les normes de publication pour les essais cliniques et les études observationnelles exigent une justification a priori de la taille de l'échantillon, et des revues méthodologiques ont documenté les préjudices généralisés d'une faible puissance. Button et ses collègues ont montré que les domaines de recherche chroniquement sous-puissants produisent des littératures peu fiables, tandis qu'Altman et Bland, ainsi que le guide de mauvaise interprétation de Greenland et ses collègues, soulignent qu'une faible puissance explique de nombreux résultats nuls non informatifs.

History

La puissance est un prolongement direct du cadre de test de Neyman-Pearson, qui a défini le taux d'erreur de type II dont la puissance est le complément. Les travaux de Jacob Cohen à partir des années 1960, consolidés dans sa monographie de 1988, ont popularisé l'analyse de puissance systématique et les conventions de taille d'effet dans les sciences de la santé et du comportement. Les préoccupations concernant la recherche sous-puissante se sont intensifiées lors des débats sur la reproductibilité dans les années 2010.

Debates

Conséquences d'une sous-puissance chronique
Une puissance constamment faible non seulement augmente le nombre de faux négatifs, mais réduit également la probabilité qu'une découverte statistiquement significative reflète un effet réel et exagère la taille de ceux qui sont rapportés, sapant ainsi la fiabilité de littératures entières.

Key figures

  • Jacob Cohen
  • Jerzy Neyman
  • Egon Pearson
  • Douglas G. Altman
  • John P. A. Ioannidis

Related topics

Seminal works

  • cohen-1988
  • button-2013

Frequently asked questions

Qu'est-ce que la puissance statistique en termes simples ?
C'est la probabilité qu'une étude détecte un effet réel d'une taille donnée si cet effet existe réellement. Une puissance plus élevée signifie une meilleure chance de ne pas manquer un effet réel ; une puissance de 80 % est un objectif courant.
Pourquoi la taille de l'échantillon est-elle si importante ?
Des échantillons plus grands augmentent la puissance et réduisent la précision des estimations, permettant ainsi à une étude de détecter de manière fiable l'effet recherché. Un échantillon trop petit risque à la fois de manquer des effets réels et de produire des résultats significatifs exagérés.

Methods for this concept

Related concepts