Доверительные множества
Доверительное множество — это зависящая от данных область, которая содержит неизвестный параметр с гарантированной долгосрочной частотой, предоставляя интервальные оценки вместо точечных.
Definition
Доверительное множество с уровнем один минус альфа — это случайное подмножество пространства параметров, вычисленное на основе данных, вероятность которого содержать истинный параметр составляет не менее одного минус альфа для каждого значения параметра.
Scope
Эта область охватывает вероятность охвата и уровень доверия, построение доверительных интервалов на основе опорных величин, двойственность между доверительными множествами и проверкой гипотез, которая строит множество путем инвертирования семейства тестов, одно- и двухсторонние интервалы, длину и ожидаемую длину интервалов, равномерно наиболее точные и несмещенные доверительные множества, а также доверительные интервалы для больших выборок, основанные на асимптотической нормальности.
Sub-topics
Core questions
- Что означает уровень доверия и что он не говорит об одном вычисленном интервале?
- Как строятся доверительные интервалы на основе опорных величин?
- Как инвертирование семейства проверок гипотез приводит к доверительному множеству?
- Что делает одно доверительное множество лучше другого того же уровня?
Key theories
- Построение на основе опорных величин
- Опорная величина — это функция данных и параметра, распределение которой известно и не зависит от параметра; инвертирование вероятностных утверждений об опорной величине дает доверительные интервалы с точным охватом.
- Двойственность тестов и доверительных множеств
- Множество значений параметров, не отвергнутых тестом уровня альфа, является доверительным множеством уровня один минус альфа, и наоборот, поэтому оптимальность тестов переносится на оптимальность доверительных множеств.
Clinical relevance
Доверительные интервалы являются стандартным способом сообщения о неопределенности в клинических испытаниях, опросах и метрологии, передавая не только точечную оценку, но и правдоподобный диапазон, а нормативные и отчетные руководства все чаще требуют их наряду с p-значениями или вместо них.
History
Нейман представил теорию доверительных интервалов в 1937 году, сформулировав интервальное оценивание как частотную гарантию охвата и установив двойственность с проверкой гипотез, которая организует эту область сегодня.
Debates
- Интерпретация отдельного доверительного интервала
- Уровень доверия является свойством процедуры при многократных выборках, а не вероятностью того, что конкретный вычисленный интервал содержит параметр; это отличие от байесовских доверительных интервалов является постоянным источником неверной интерпретации.
Key figures
- Jerzy Neyman
- Erich L. Lehmann
- George Casella
- Roger L. Berger
Related topics
Seminal works
- casella2002
Frequently asked questions
- Содержит ли 95-процентный доверительный интервал параметр с вероятностью 0,95?
- Не для одного вычисленного интервала. 95 процентов относятся к процедуре: при многократных повторениях около 95 процентов интервалов, которые она производит, будут содержать истинный параметр.
- Чем доверительный интервал отличается от байесовского доверительного интервала?
- Доверительный интервал гарантирует частоту охвата при многократной выборке, в то время как доверительный интервал является утверждением о апостериорной вероятности параметра, учитывая данные и априорное распределение; они отвечают на разные вопросы и не обязательно должны совпадать.