Bảng Tần Số Liên Hợp và Bảng 2×2
Bảng tần số liên hợp là một mảng hình chữ nhật chứa các số đếm phân loại một mẫu theo hai (hoặc nhiều hơn) biến định tính, cho thấy có bao nhiêu quan sát rơi vào mỗi sự kết hợp của các danh mục. Dạng đơn giản nhất và quan trọng nhất của nó trong nghiên cứu sức khỏe là bảng 2×2, phân loại chéo một phơi nhiễm nhị phân với một kết cục nhị phân và là điểm khởi đầu cho hầu hết mọi phép đo và kiểm định mối liên hệ.
Definition
Bảng tần số liên hợp là một phân loại chéo của một mẫu thành một lưới các ô mà các mục nhập của chúng là tần số của các quan sát chia sẻ một sự kết hợp nhất định của các danh mục của hai hoặc nhiều biến định tính; bảng 2×2 là trường hợp đặc biệt với hai biến nhị phân và bốn ô.
Scope
Mục này bao gồm cách các số đếm được sắp xếp vào bảng tần số liên hợp, cấu trúc và ký hiệu của bảng 2×2 (bảng bốn ô), các phân phối biên và phân phối đồng thời mà nó hiển thị, ý tưởng về sự độc lập giữa các biến hàng và cột, và vai trò của bảng như là nền tảng chung để tính toán các kiểm định chi bình phương, kiểm định chính xác và các thước đo hiệu ứng. Nó coi bảng như một đối tượng phương pháp luận, không phải là hướng dẫn lâm sàng.
Core questions
- Hai biến định tính được phân loại chéo thành các ô đếm như thế nào?
- Tổng biên và tần số ô đồng thời là gì, và chúng liên quan như thế nào dưới sự độc lập?
- Tại sao bảng 2×2 là bố cục chuẩn cho một phơi nhiễm nhị phân và một kết cục nhị phân?
- Các ô sẽ chứa những số đếm dự kiến nào nếu các biến hàng và cột là độc lập?
Key concepts
- Hàng, cột và ô
- Tổng biên và tổng chung
- Phân phối đồng thời và phân phối có điều kiện
- Sự độc lập và số đếm dự kiến dưới sự độc lập
- Bố cục bảng 2×2 (bốn ô) a, b, c, d
- Bảng phân loại chéo phơi nhiễm-theo-kết cục
Mechanisms
Mỗi quan sát được đặt chính xác vào một ô theo sự kết hợp các danh mục của nó, do đó bảng ghi lại phân phối tần số đồng thời; tổng hợp theo hàng hoặc cột cho tổng biên, và chia các ô cho các biên cho các phân phối có điều kiện. Dưới giả thuyết rằng hai biến là độc lập, số đếm dự kiến trong một ô là tích của tổng biên hàng và tổng biên cột của nó chia cho tổng chung, và sự khác biệt giữa số đếm quan sát và số đếm dự kiến là những gì các kiểm định mối liên hệ đánh giá. Trong trường hợp 2×2, bốn ô thường được ký hiệu là a, b, c, d (phơi nhiễm-bệnh, phơi nhiễm-không bệnh, không phơi nhiễm-bệnh, không phơi nhiễm-không bệnh), và bốn số này trực tiếp cho tỷ số nguy cơ, tỷ số chênh và thống kê chi bình phương. Các bảng r×c lớn hơn và các bảng đa chiều mở rộng cùng một logic, và việc phân tầng một bảng 2×2 theo một biến thứ ba tạo ra các bảng phân lớp được sử dụng trong phân tích Mantel-Haenszel.
Clinical relevance
Bảng 2×2 là dạng mà dữ liệu về độ chính xác chẩn đoán, hiệu quả điều trị và yếu tố nguy cơ thường được trình bày nhất, vì vậy khả năng đọc một bảng – để xác định các ô, các biên và những gì đang được so sánh – là cơ bản để đánh giá bằng chứng sức khỏe. Đây là một cách tổ chức và đọc dữ liệu và bản thân nó không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
Epidemiology
Các nghiên cứu đoàn hệ, nghiên cứu bệnh-chứng và nghiên cứu cắt ngang, và các thử nghiệm ngẫu nhiên có điểm cuối nhị phân, tất cả đều cô đọng ở cốt lõi thành một bảng 2×2 của một phơi nhiễm hoặc can thiệp so với một kết cục; các nghiên cứu xét nghiệm chẩn đoán sử dụng bảng 2×2 của kết quả xét nghiệm so với tình trạng thực sự. Do đó, bảng là điểm khởi đầu tính toán chung giữa các thiết kế nghiên cứu trong dịch tễ học.
History
Thuật ngữ “bảng tần số liên hợp” có nguồn gốc từ Karl Pearson khoảng năm 1900, và bài báo năm 1922 của Fisher đã làm rõ cách phân tích các bảng như vậy và các bậc tự do liên quan. Bảng bốn ô (2×2) đã trở thành công cụ chủ yếu của thống kê y học thế kỷ XX, và các văn bản tham khảo của Fleiss và Agresti đã hệ thống hóa ký hiệu của nó và họ các thước đo và kiểm định được xây dựng trên đó.
Key figures
- Karl Pearson
- Ronald A. Fisher
- Joseph Fleiss
- Alan Agresti
Related topics
Seminal works
- fisher-1922
- fleiss-2003
- agresti-2013
Frequently asked questions
- Bảng 2×2 là gì?
- Đây là bảng tần số liên hợp đơn giản nhất: hai hàng và hai cột phân loại chéo một phơi nhiễm (hoặc can thiệp) nhị phân với một kết cục nhị phân, cho ra bốn ô mà số đếm của chúng được sử dụng để tính tỷ số nguy cơ, tỷ số chênh và các kiểm định chi bình phương.
- “Độc lập” có nghĩa là gì trong bảng tần số liên hợp?
- Hai biến là độc lập khi phân phối của biến này không phụ thuộc vào biến kia; dưới sự độc lập, số đếm dự kiến trong mỗi ô bằng tổng hàng của nó nhân với tổng cột của nó chia cho tổng chung, và các kiểm định mối liên hệ đo lường sự sai lệch so với điều này.