ScholarGate
Ассистент

Критерии хи-квадрат и точный критерий Фишера

Критерий хи-квадрат и точный критерий Фишера являются двумя стандартными процедурами для определения того, связаны ли две категориальные переменные в таблице сопряженности или независимы. Критерий хи-квадрат сравнивает наблюдаемые частоты ячеек с ожидаемыми при условии независимости, используя аппроксимацию для больших выборок, в то время как точный критерий Фишера непосредственно вычисляет вероятность наблюдаемой таблицы и используется, когда частоты малы.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Критерий хи-квадрат для оценки ассоциации измеряет расхождение между наблюдаемыми и ожидаемыми частотами ячеек при нулевой гипотезе независимости, относя полученную статистику к распределению хи-квадрат; точный критерий Фишера вместо этого вычисляет, исходя из гипергеометрического распределения с фиксированными маргинальными суммами, точную вероятность таблиц, столь же или более экстремальных, чем наблюдаемая.

Scope

Эта статья охватывает статистику хи-квадрат Пирсона и ее степени свободы, условие ожидаемых частот, которое обосновывает аппроксимацию хи-квадрат, поправку на непрерывность (Йейтса), логику точного критерия Фишера, основанную на гипергеометрическом распределении, и практический вопрос о том, когда точный критерий должен заменять аппроксимацию. Она представляет их как критерии ассоциации, а не как клинические рекомендации, и отмечает, что они оценивают наличие ассоциации, а не ее величину.

Core questions

  • Являются ли две категориальные переменные в этой таблице независимыми, или есть доказательства ассоциации?
  • Как формируется статистика хи-квадрат из наблюдаемых и ожидаемых частот, и сколько степеней свободы она имеет?
  • Когда ожидаемые частоты слишком малы, чтобы доверять аппроксимации хи-квадрат?
  • Как точный критерий Фишера избегает аппроксимации для больших выборок, и что означает «обусловливание на маргинальных суммах»?

Key concepts

  • Наблюдаемые против ожидаемых частот
  • Статистика хи-квадрат Пирсона
  • Степени свободы (r-1)(c-1)
  • Аппроксимация для больших выборок (асимптотическая)
  • Эмпирическое правило для ожидаемых частот
  • Поправка на непрерывность Йейтса
  • Гипергеометрическое распределение и фиксированные маргинальные суммы
  • Точные против асимптотических p-значений

Mechanisms

При условии независимости ожидаемая частота каждой ячейки равна произведению суммы по строке на сумму по столбцу, деленному на общую сумму. Статистика хи-квадрат Пирсона суммирует квадраты разностей между наблюдаемыми и ожидаемыми частотами, деленные на ожидаемую частоту, по всем ячейкам; для таблицы r×c эта статистика сравнивается с распределением хи-квадрат с (r−1)(c−1) степенями свободы, что является результатом для степеней свободы, уточненным Фишером в 1922 году. Аппроксимация ухудшается, когда ожидаемые частоты малы, что привело к общему правилу, согласно которому ожидаемые частоты должны, как правило, превышать примерно пять; поправка на непрерывность Йейтса была предложена для улучшения аппроксимации 2×2. Точный критерий Фишера обходит аппроксимацию, рассматривая маргинальные суммы по строкам и столбцам как фиксированные и вычисляя, исходя из гипергеометрического распределения, точную вероятность наблюдаемой таблицы и каждой более экстремальной таблицы, суммируя их в p-значение. Поскольку он является точным, его предпочитают для разреженных таблиц, хотя обзоры отмечают его условный, консервативный характер и рекомендуют конкретный выбор среди доступных критериев.

Clinical relevance

То, сообщает ли исследование о связи воздействия с исходом, часто зависит от одного из этих критериев, поэтому понимание того, что они делают — и что малое p-значение сигнализирует об ассоциации, но ничего не говорит о ее размере — является частью оценки медицинских исследований. Эти критерии являются инструментами для оценки доказательств ассоциации и не являются основой для индивидуальных диагностических или лечебных решений.

Epidemiology

Критерии хи-квадрат и точный критерий Фишера являются стандартными критериями значимости для таблиц сопряженности 2×2 и более крупных в эпидемиологии и клинических исследованиях, сопровождающими отношения рисков и отношения шансов, которые количественно оценивают те же ассоциации. Точный критерий регулярно применяется для малых выборок или редких событий, где аппроксимация хи-квадрат ненадежна.

History

Карл Пирсон ввел статистику хи-квадрат для проверки согласия в 1900 году; статья Фишера 1922 года скорректировала степени свободы для таблиц сопряженности, и Фишер позднее разработал точный критерий, носящий его имя, для малых выборок. Йейтс предложил свою поправку на непрерывность для таблиц 2×2 в 1934 году. Современные рекомендации по этим и связанным процедурам были синтезированы в методологических обзорах и учебниках.

Debates

Точные против асимптотических критериев для малых таблиц 2×2
Точный критерий Фишера обусловливает обе маргинальные суммы и является точным, но имеет тенденцию быть консервативным, в то время как нескорректированный хи-квадрат может быть антиконсервативным для малых выборок, а поправка Йейтса чрезмерно корректирует; поэтому обзоры дают нюансированные рекомендации, а не единое правило.

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Frank Yates
  • Alan Agresti

Related topics

Seminal works

  • pearson-1900
  • fisher-1922
  • lydersen-2009

Frequently asked questions

Когда следует использовать точный критерий Фишера вместо критерия хи-квадрат?
Когда таблица мала или разрежена — обычно, когда одна или несколько ожидаемых частот ячеек низки — аппроксимация хи-квадрат для больших выборок может быть ненадежной, и предпочтительнее использовать точный критерий Фишера, который вычисляет точную вероятность.
Показывает ли значимый критерий хи-квадрат, насколько сильна ассоциация?
Нет. Эти критерии указывают на наличие доказательств ассоциации; размер ассоциации передается отдельной мерой эффекта, такой как отношение рисков или отношение шансов, которые должны быть представлены вместе с p-значением.

Methods for this concept

Related concepts