ScholarGate
Ассистент

Таблицы сопряженности и таблицы 2×2

Таблица сопряженности — это прямоугольная матрица частот, которая перекрестно классифицирует выборку по двум (или более) категориальным переменным, показывая, сколько наблюдений попадает в каждую комбинацию категорий. Ее простейшая и наиболее важная форма в исследованиях в области здравоохранения — это таблица 2×2, которая перекрестно табулирует бинарное воздействие с бинарным исходом и является отправной точкой для почти каждой меры и теста ассоциации.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Таблица сопряженности — это перекрестная классификация выборки в сетку ячеек, записи которых представляют собой частоты наблюдений, имеющих заданную комбинацию категорий двух или более категориальных переменных; таблица 2×2 — это частный случай с двумя бинарными переменными и четырьмя ячейками.

Scope

Эта статья охватывает то, как частоты располагаются в таблице сопряженности, анатомию и обозначения таблицы 2×2 (четырехпольной), предельные и совместные распределения, которые она отображает, идею независимости между переменными строк и столбцов, а также роль таблицы как общего субстрата, из которого вычисляются критерии хи-квадрат, точные критерии и меры эффекта. Она рассматривает таблицу как методологический объект, а не как клиническое руководство.

Core questions

  • Как две категориальные переменные перекрестно классифицируются в ячейки частот?
  • Что такое предельные суммы и совместные частоты ячеек, и как они связаны в условиях независимости?
  • Почему таблица 2×2 является каноническим представлением для бинарного воздействия и бинарного исхода?
  • Какие ожидаемые частоты содержались бы в ячейках, если бы переменные строк и столбцов были независимы?

Key concepts

  • Строки, столбцы и ячейки
  • Предельные суммы и общая сумма
  • Совместные и условные распределения
  • Независимость и ожидаемые частоты при независимости
  • Расположение таблицы 2×2 (четырехпольной) a, b, c, d
  • Перекрестная табуляция воздействия по исходу

Mechanisms

Каждое наблюдение помещается ровно в одну ячейку в соответствии с его комбинацией категорий, поэтому таблица фиксирует совместное распределение частот; суммирование по строке или столбцу дает предельные суммы, а деление ячеек на предельные суммы дает условные распределения. Согласно гипотезе о независимости двух переменных, ожидаемое количество в ячейке является произведением ее предельных сумм по строке и столбцу, деленным на общую сумму, а расхождения между наблюдаемыми и ожидаемыми количествами оцениваются тестами ассоциации. В случае 2×2 четыре ячейки условно обозначаются a, b, c, d (воздействие-случай, воздействие-неслучай, отсутствие воздействия-случай, отсутствие воздействия-неслучай), и эти четыре числа непосредственно дают отношение рисков, отношение шансов и статистику хи-квадрат. Более крупные таблицы r×c и многомерные таблицы расширяют ту же логику, а стратификация таблицы 2×2 по третьей переменной приводит к многослойным таблицам, используемым в анализе Мантеля-Хензеля.

Clinical relevance

Таблица 2×2 — это форма, в которой чаще всего представляются данные о диагностической точности, эффекте лечения и факторах риска, поэтому умение читать ее — идентифицировать ячейки, предельные суммы и то, что сравнивается — является основой для оценки доказательств в области здравоохранения. Это способ организации и чтения данных, а не основа для индивидуальных диагностических или лечебных решений.

Epidemiology

Когортные исследования, исследования случай-контроль, поперечные исследования и рандомизированные исследования с бинарными конечными точками — все они по своей сути сводятся к таблице 2×2 воздействия или вмешательства против исхода; исследования диагностических тестов используют таблицу 2×2 результата теста против истинного статуса. Таким образом, таблица является общей вычислительной отправной точкой для всех дизайнов исследований в эпидемиологии.

History

Термин «таблица сопряженности» восходит к Карлу Пирсону примерно к 1900 году, а статья Фишера 1922 года прояснила, как анализируются такие таблицы и какие степени свободы при этом задействованы. Четырехпольная (2×2) таблица стала основным инструментом медицинской статистики двадцатого века, а справочники Флейса и Агрести кодифицировали ее обозначения и семейство мер и тестов, построенных на ее основе.

Key figures

  • Karl Pearson
  • Ronald A. Fisher
  • Joseph Fleiss
  • Alan Agresti

Related topics

Seminal works

  • fisher-1922
  • fleiss-2003
  • agresti-2013

Frequently asked questions

Что такое таблица 2×2?
Это простейшая таблица сопряженности: две строки и два столбца, перекрестно классифицирующие бинарное воздействие (или вмешательство) по бинарному исходу, дающие четыре ячейки, частоты которых используются для вычисления отношений рисков, отношений шансов и критериев хи-квадрат.
Что означает «независимость» в таблице сопряженности?
Две переменные независимы, когда распределение одной не зависит от другой; при независимости ожидаемое количество в каждой ячейке равно произведению суммы по строке на сумму по столбцу, деленному на общую сумму, а тесты ассоциации измеряют отклонения от этого.

Methods for this concept

Related concepts