Sai lệch thông tin
Sai lệch thông tin là một lỗi hệ thống phát sinh từ việc đo lường hoặc phân loại không chính xác phơi nhiễm, kết cục hoặc các biến nhiễu. Khi các đối tượng được xếp vào sai loại — người phơi nhiễm bị tính là không phơi nhiễm, hoặc người bệnh bị tính là không bệnh — sự phân loại sai lệch này có thể làm sai lệch mối liên hệ ước tính. Ảnh hưởng của nó phụ thuộc rất nhiều vào việc các lỗi này không liên quan đến biến khác (không phân biệt) hay có liên quan đến biến đó (phân biệt).
Definition
Sai lệch thông tin là sự bóp méo mối liên hệ giữa phơi nhiễm và kết cục do lỗi trong việc đo lường hoặc phân loại phơi nhiễm, kết cục hoặc các biến nghiên cứu khác, khiến các đối tượng bị gán một cách có hệ thống vào các loại không chính xác.
Scope
Mục này bao gồm các nguồn lỗi đo lường, sự khác biệt chính giữa phân loại sai lệch không phân biệt và phân loại sai lệch phân biệt cùng với hướng ảnh hưởng điển hình của chúng, và các dạng phổ biến được đặt tên như sai lệch hồi tưởng và sai lệch phỏng vấn viên. Đây là một tài liệu tham khảo về phương pháp luận và không cung cấp hướng dẫn lâm sàng.
Core questions
- Phơi nhiễm và kết cục đã được đo lường hoặc phân loại chính xác đến mức nào?
- Sự phân loại sai lệch có phải là không phân biệt hay phân biệt đối với biến khác?
- Hướng mà sự phân loại sai lệch dự kiến sẽ đẩy ước tính là gì?
- Liệu quá trình đo lường có thể phụ thuộc vào kiến thức về tình trạng phơi nhiễm hoặc bệnh tật không?
Key concepts
- Phân loại sai lệch
- Phân loại sai lệch không phân biệt
- Phân loại sai lệch phân biệt
- Sai lệch hồi tưởng
- Sai lệch phỏng vấn viên / quan sát viên
- Độ nhạy và độ đặc hiệu của phép đo
- Suy giảm hồi quy
Mechanisms
Sai lệch thông tin bắt nguồn từ các công cụ đo lường không hoàn hảo, khả năng hồi tưởng sai sót hoặc phân loại không nhất quán. Hậu quả của nó phụ thuộc vào một sự khác biệt quan trọng. Phân loại sai lệch không phân biệt, trong đó các lỗi không liên quan đến biến khác, thường (đối với phơi nhiễm nhị phân với hai loại) làm sai lệch ước tính về phía giá trị null, làm mờ đi một hiệu ứng thực sự. Phân loại sai lệch phân biệt, trong đó lỗi ở một biến phụ thuộc vào giá trị của biến kia — ví dụ, các ca bệnh nhớ lại các phơi nhiễm trong quá khứ kỹ lưỡng hơn nhóm chứng (sai lệch hồi tưởng), hoặc phỏng vấn viên thăm dò các đối tượng phơi nhiễm kỹ hơn (sai lệch phỏng vấn viên) — có thể làm sai lệch ước tính theo cả hai hướng và khó dự đoán hơn. Vì sai lệch thông tin phát sinh trong quá trình thu thập dữ liệu, nó khác biệt về mặt khái niệm với nhiễu (một nguyên nhân chung) và sai lệch chọn lọc (được thúc đẩy bởi những người được đưa vào). Lỗi đo lường trong một biến nhiễu cũng có thể để lại nhiễu tồn dư ngay cả sau khi điều chỉnh.
Clinical relevance
Sai lệch thông tin là một lý do khiến một mối liên hệ được báo cáo có thể quá mạnh, quá yếu hoặc đi sai hướng, vì vậy việc xem xét kỹ lưỡng cách thức đo lường phơi nhiễm và kết cục là một phần của việc đánh giá bằng chứng. Khái niệm này mô tả cách các phát hiện nghiên cứu có thể bị bóp méo; nó không phải là lời khuyên cho việc chẩn đoán hoặc điều trị của bất kỳ cá nhân nào.
Epidemiology
Sai lệch thông tin là một mối lo ngại trong mọi thiết kế nghiên cứu nhưng đặc biệt nổi bật khi phơi nhiễm được báo cáo sau khi kết cục đã được biết — ví dụ như sai lệch hồi tưởng trong các nghiên cứu bệnh chứng — và khi việc xác định kết cục có thể khác nhau tùy theo tình trạng phơi nhiễm. Nhận thức về phân loại sai lệch thúc đẩy các nghiên cứu phụ xác nhận và đo lường mù hoặc tiêu chuẩn hóa.
History
Các sai lệch hồi tưởng, phỏng vấn viên và quan sát viên đã được phân loại trong dịch tễ học thế kỷ XX như những mối đe dọa tái diễn trong các nghiên cứu quan sát. Việc xử lý chính thức phân loại sai lệch theo độ nhạy và độ đặc hiệu, và kết quả là lỗi không phân biệt thường làm sai lệch về phía giá trị null, đã trở thành một phần tiêu chuẩn của các văn bản phương pháp luận, trong khi các bảng thuật ngữ như của Delgado-Rodríguez và Llorca (2004) đã sắp xếp nhiều sai lệch thông tin được đặt tên.
Debates
- Liệu phân loại sai lệch không phân biệt luôn làm sai lệch về phía giá trị null?
- Kết quả sai lệch về phía giá trị null đúng trong các điều kiện phổ biến (đáng chú ý là lỗi độc lập, không phân biệt trong một phơi nhiễm nhị phân), nhưng các trường hợp ngoại lệ phát sinh với nhiều hơn hai loại phơi nhiễm hoặc với các lỗi phụ thuộc, vì vậy trực giác 'luôn bảo thủ' có thể gây hiểu lầm.
Key figures
- Kenneth Rothman
- Sander Greenland
- Miquel Delgado-Rodríguez
Related topics
Seminal works
- delgado-rodriguez-2004
- grimes-schulz-2002-bias
Frequently asked questions
- Sự khác biệt giữa phân loại sai lệch phân biệt và không phân biệt là gì?
- Phân loại sai lệch không phân biệt có nghĩa là các lỗi đo lường không liên quan đến biến khác và thường (đối với phơi nhiễm nhị phân) làm sai lệch về phía giá trị null; phân loại sai lệch phân biệt có nghĩa là lỗi phụ thuộc vào biến khác và có thể làm sai lệch ước tính theo cả hai hướng.
- Sai lệch hồi tưởng có phải là một loại sai lệch thông tin không?
- Có. Sai lệch hồi tưởng là một sai lệch thông tin phân biệt trong đó các đối tượng có kết cục nhớ lại hoặc báo cáo các phơi nhiễm trong quá khứ khác với những người không có kết cục, làm sai lệch mối liên hệ được đo lường.
- Sai lệch thông tin khác với sai lệch chọn lọc như thế nào?
- Sai lệch thông tin đến từ cách các biến được đo lường hoặc phân loại, trong khi sai lệch chọn lọc đến từ những người được đưa vào hoặc giữ lại để phân tích.