Kiểm duyệt và Dữ liệu theo dõi
Kiểm duyệt là đặc điểm xác định của dữ liệu thời gian đến sự kiện: đối với một số đối tượng, sự kiện quan tâm chưa xảy ra vào cuối thời gian quan sát, do đó thời gian xảy ra sự kiện thực sự của họ không được biết và chỉ được biết là nằm ngoài thời gian theo dõi được ghi nhận cuối cùng của họ. Xử lý thông tin một phần này một cách chính xác — thay vì loại bỏ các đối tượng được quan sát không đầy đủ — là điều làm cho phân tích sống còn khác biệt so với các phương pháp thống kê thông thường.
Definition
Kiểm duyệt là việc quan sát không đầy đủ thời gian xảy ra một sự kiện: một đối tượng bị kiểm duyệt phải khi họ không có sự kiện tại lần theo dõi cuối cùng, bị kiểm duyệt trái khi sự kiện được biết là đã xảy ra trước khi bắt đầu quan sát, và bị kiểm duyệt khoảng khi chỉ biết rằng nó nằm giữa hai thời điểm đánh giá.
Scope
Chủ đề này bao gồm các loại kiểm duyệt (phải, trái, khoảng) và cắt cụt, các giả định làm cho dữ liệu bị kiểm duyệt có thể sử dụng được — chủ yếu là kiểm duyệt không mang tính thông tin — và vai trò của thời gian theo dõi và mất theo dõi. Đây là một tài liệu tham khảo về phương pháp luận và không đề cập đến việc quản lý lâm sàng của từng bệnh nhân.
Core questions
- Quan sát bị kiểm duyệt có nghĩa là gì, và các loại kiểm duyệt chính là gì?
- Tại sao các đối tượng bị kiểm duyệt không thể đơn giản bị loại bỏ khỏi phân tích?
- Giả định kiểm duyệt không mang tính thông tin (độc lập) là gì, và khi nào nó có thể thất bại?
- Thời gian theo dõi và mất theo dõi ảnh hưởng đến tính hợp lệ của các ước tính sống còn như thế nào?
Key concepts
- Kiểm duyệt phải
- Kiểm duyệt trái
- Kiểm duyệt khoảng
- Cắt cụt trái (nhập muộn)
- Kiểm duyệt hành chính
- Kiểm duyệt không mang tính thông tin (độc lập)
- Mất theo dõi
- Thời gian có nguy cơ và thời gian người
Mechanisms
Khi sự kiện không được quan sát đối với một đối tượng, hồ sơ của họ vẫn đóng góp thông tin cho đến thời điểm cuối cùng họ được biết là không có sự kiện; các phương pháp sống còn sử dụng điều này bằng cách tính đối tượng vào tập hợp rủi ro cho đến thời điểm kiểm duyệt của họ. Yêu cầu chính là kiểm duyệt không mang tính thông tin: lý do một đối tượng bị kiểm duyệt phải không liên quan đến nguy cơ tiềm ẩn của họ về sự kiện, để những người còn lại trong quan sát đại diện cho những người đã bị kiểm duyệt. Khi điều này thất bại — ví dụ, khi những bệnh nhân ốm yếu hơn bị mất theo dõi một cách ưu tiên — các ước tính sống còn trở nên sai lệch. Kiểm duyệt phải (không có sự kiện vào cuối nghiên cứu hoặc khi bỏ cuộc) là hình thức phổ biến nhất trong nghiên cứu y học; kiểm duyệt trái và kiểm duyệt khoảng phát sinh khi thời gian xảy ra sự kiện chỉ được biết một phần (Leung et al., 1997; Clark et al., 2003).
Clinical relevance
Việc theo dõi của một nghiên cứu có hoàn chỉnh hay không và liệu việc bỏ cuộc có liên quan đến tiên lượng hay không là yếu tố trung tâm để đánh giá bất kỳ kết quả sống còn nào, vì kiểm duyệt mang tính thông tin có thể làm sai lệch các báo cáo về sống còn và hiệu quả điều trị. Chủ đề này giải thích tại sao những đặc điểm đó lại quan trọng; nó mô tả các cân nhắc phân tích và không phải là hướng dẫn lâm sàng.
Epidemiology
Kiểm duyệt phổ biến trong các nghiên cứu đoàn hệ và thử nghiệm lâm sàng với thời gian theo dõi hữu hạn; mất theo dõi là một mối đe dọa được công nhận đối với tính hợp lệ, và việc theo dõi không đầy đủ thường xuyên được báo cáo và xem xét kỹ lưỡng trong các ấn phẩm dịch tễ học và thử nghiệm (Leung et al., 1997).
Evidence & guidelines
Không có hướng dẫn lâm sàng nào cho việc kiểm duyệt; các tiêu chuẩn tham chiếu là các công trình thống kê cơ bản và các văn bản thống kê sinh học. Kaplan và Meier (1958) đã xây dựng ước tính từ các quan sát không đầy đủ, và các văn bản như Klein và Moeschberger (2003) và Collett (2015) xử lý kiểm duyệt và cắt cụt một cách có hệ thống, trong khi các tiêu chuẩn báo cáo cho các thử nghiệm và đoàn hệ nhấn mạnh việc theo dõi đầy đủ và không thiên vị.
History
Việc xử lý các thời gian sống được quan sát không đầy đủ có nguồn gốc từ các bảng tử suất bảo hiểm, nhưng việc xử lý thống kê chính thức dữ liệu bị kiểm duyệt đã được củng cố cùng với ước tính Kaplan-Meier vào năm 1958, với tiêu đề — 'Ước tính phi tham số từ các quan sát không đầy đủ' — trực tiếp nêu tên vấn đề. Các văn bản sau đó đã làm rõ phân loại kiểm duyệt và cắt cụt và các giả định độc lập mà suy luận hợp lệ phụ thuộc vào (Klein & Moeschberger, 2003).
Debates
- Khi nào kiểm duyệt mang tính thông tin, và nên giải quyết nó như thế nào?
- Các phương pháp tiêu chuẩn giả định kiểm duyệt độc lập với nguy cơ sự kiện; khi việc bỏ cuộc liên quan đến tiên lượng, giả định này thất bại, làm sai lệch các ước tính, và có công trình phương pháp luận đang diễn ra về phân tích độ nhạy và các mô hình cho kiểm duyệt phụ thuộc.
Key figures
- Edward L. Kaplan
- Paul Meier
- John P. Klein
- Melvin L. Moeschberger
Related topics
Seminal works
- kaplan-meier-1958
- leung-1997
Frequently asked questions
- Tại sao không loại trừ những đối tượng mà sự kiện của họ không bao giờ được quan sát?
- Việc loại trừ các đối tượng bị kiểm duyệt sẽ loại bỏ thông tin thực tế về thời gian họ không có sự kiện và làm sai lệch kết quả theo hướng những người đã có sự kiện; thay vào đó, các phương pháp sống còn giữ các đối tượng bị kiểm duyệt trong tập hợp rủi ro cho đến lần theo dõi cuối cùng của họ.
- Kiểm duyệt không mang tính thông tin là gì?
- Đó là giả định rằng lý do một đối tượng bị kiểm duyệt không liên quan đến nguy cơ tiềm ẩn của họ về sự kiện, để những người vẫn đang được quan sát đại diện công bằng cho những người đã bị kiểm duyệt; nếu nó thất bại, các ước tính sống còn có thể bị sai lệch.