Ensembles de confiance
Un ensemble de confiance est une région dépendante des données qui contient le paramètre inconnu avec une fréquence garantie à long terme, fournissant des estimations par intervalle plutôt que des estimations ponctuelles.
Definition
Un ensemble de confiance de niveau un moins alpha est un sous-ensemble aléatoire de l'espace des paramètres, calculé à partir des données, dont la probabilité de contenir le vrai paramètre est au moins un moins alpha pour chaque valeur du paramètre.
Scope
Ce domaine couvre la probabilité de couverture et le niveau de confiance, la construction d'intervalles de confiance à partir de quantités pivots, la dualité entre les ensembles de confiance et les tests d'hypothèses qui construit un ensemble en inversant une famille de tests, les intervalles unilatéraux et bilatéraux, la longueur et la longueur attendue des intervalles, les ensembles de confiance uniformément les plus précis et non biaisés, et les intervalles de confiance pour grands échantillons basés sur la normalité asymptotique.
Sub-topics
Core questions
- Que signifie le niveau de confiance, et que ne dit-il pas à propos d'un intervalle calculé unique ?
- Comment les intervalles de confiance sont-ils construits à partir de quantités pivots ?
- Comment l'inversion d'une famille de tests d'hypothèses produit-elle un ensemble de confiance ?
- Qu'est-ce qui rend un ensemble de confiance meilleur qu'un autre de même niveau ?
Key theories
- Construction pivotale
- Un pivot est une fonction des données et du paramètre dont la distribution est connue et indépendante du paramètre ; l'inversion des énoncés de probabilité concernant le pivot produit des intervalles de confiance avec une couverture exacte.
- Dualité des tests et des ensembles de confiance
- L'ensemble des valeurs de paramètres non rejetées par un test de niveau alpha est un ensemble de confiance de niveau un moins alpha, et inversement, de sorte que l'optimalité des tests se transfère à l'optimalité des ensembles de confiance.
Clinical relevance
Les intervalles de confiance sont la méthode standard pour rapporter l'incertitude dans les essais cliniques, les enquêtes et la métrologie, transmettant non seulement une estimation ponctuelle mais aussi une plage plausible, et les directives réglementaires et de rapport les exigent de plus en plus en complément ou à la place des valeurs p.
History
Neyman a introduit la théorie des intervalles de confiance en 1937, présentant l'estimation par intervalle comme une garantie de couverture fréquentiste et établissant la dualité avec les tests d'hypothèses qui organise le sujet aujourd'hui.
Debates
- Interprétation d'un intervalle de confiance unique
- Le niveau de confiance est une propriété de la procédure sur des échantillons répétés, et non la probabilité qu'un intervalle calculé particulier contienne le paramètre ; cette distinction avec les intervalles crédibles bayésiens est une source récurrente de mauvaise interprétation.
Key figures
- Jerzy Neyman
- Erich L. Lehmann
- George Casella
- Roger L. Berger
Related topics
Seminal works
- casella2002
Frequently asked questions
- Un intervalle de confiance à 95 % contient-il le paramètre avec une probabilité de 0,95 ?
- Non, pas pour un intervalle calculé unique. Les 95 % se réfèrent à la procédure : sur de nombreuses répétitions, environ 95 % des intervalles qu'elle produit contiendraient le vrai paramètre.
- En quoi un intervalle de confiance diffère-t-il d'un intervalle crédible bayésien ?
- Un intervalle de confiance garantit une fréquence de couverture sur des échantillonnages répétés, tandis qu'un intervalle crédible est une déclaration de probabilité a posteriori concernant le paramètre étant donné les données et une distribution a priori ; ils répondent à des questions différentes et n'ont pas nécessairement à coïncider.