Tính không đồng nhất trong phân tích tổng hợp
Tính không đồng nhất trong phân tích tổng hợp là sự biến thiên của các hiệu ứng thực giữa các nghiên cứu được kết hợp, vượt quá sự biến thiên dự kiến chỉ từ sai số lấy mẫu. Khi các nghiên cứu khác nhau về quần thể, can thiệp, thiết kế hoặc cách thực hiện, kết quả của chúng có thể thực sự khác biệt, và việc định lượng sự biến thiên đó là yếu tố trung tâm để quyết định liệu có nên và làm thế nào để gộp chúng lại.
Definition
Tính không đồng nhất là mức độ mà các hiệu ứng thực được ước tính bởi các nghiên cứu trong một phân tích tổng hợp khác biệt với nhau vượt quá những gì có thể mong đợi chỉ từ sự ngẫu nhiên (sai số lấy mẫu).
Scope
Mục này bao gồm ý nghĩa của tính không đồng nhất, sự phân biệt giữa tính không đồng nhất lâm sàng, phương pháp luận và thống kê, các thống kê phổ biến được sử dụng để phát hiện và định lượng nó (Cochran's Q, thống kê I-squared và phương sai giữa các nghiên cứu tau-squared), và cách tính không đồng nhất thông báo lựa chọn mô hình và cách giải thích một ước tính gộp. Đây là một chủ đề về phương pháp luận, không phải hướng dẫn lâm sàng.
Core questions
- Các nghiên cứu được kết hợp có ước tính cùng một hiệu ứng, hay một loạt các hiệu ứng?
- Bao nhiêu phần trăm sự biến thiên quan sát được giữa các nghiên cứu vượt quá sự ngẫu nhiên?
- Những nguồn khác biệt nào có thể giải thích sự biến thiên, và chúng nên thay đổi phân tích như thế nào?
Key concepts
- Tính không đồng nhất lâm sàng, phương pháp luận và thống kê
- Thử nghiệm Cochran's Q
- Thống kê I-squared
- Phương sai giữa các nghiên cứu (tau-squared)
- Mô hình hiệu ứng ngẫu nhiên
- Phân tích phân nhóm và hồi quy tổng hợp
- Khoảng dự đoán
Mechanisms
Ngay cả khi mỗi nghiên cứu ước tính chính xác cùng một hiệu ứng, kết quả của chúng sẽ phân tán do sai số lấy mẫu. Tính không đồng nhất là sự biến thiên thực sự bổ sung trong các hiệu ứng cơ bản. Thử nghiệm Cochran's Q kiểm tra xem sự phân tán quan sát được có vượt quá sự ngẫu nhiên hay không nhưng có công suất thấp khi số lượng nghiên cứu ít và phát hiện những khác biệt không đáng kể khi số lượng nghiên cứu nhiều. Thống kê I-squared thể hiện tỷ lệ tổng biến thiên có thể quy cho sự khác biệt giữa các nghiên cứu hơn là sự ngẫu nhiên, giúp dễ giải thích hơn giữa các phân tích. Phương sai giữa các nghiên cứu, tau-squared, định lượng sự phân tán của các hiệu ứng thực trên thang đo cỡ hiệu ứng và là tham số mà mô hình hiệu ứng ngẫu nhiên thêm vào quá trình gộp. Khi có sự không đồng nhất đáng kể, một ước tính tóm tắt duy nhất có thể ít thông tin hơn so với việc mô tả sự phân bố của các hiệu ứng, ví dụ với một khoảng dự đoán, và các nhà phân tích có thể khám phá các nguồn biến thiên thông qua các phân tích phân nhóm được xác định trước hoặc hồi quy tổng hợp thay vì coi tính không đồng nhất chỉ là nhiễu.
Clinical relevance
Mức độ không đồng nhất ảnh hưởng đến cách đọc kết quả gộp: một tóm tắt chính xác rút ra từ các nghiên cứu rất không đồng nhất có thể không áp dụng đồng nhất trên các bối cảnh khác nhau. Do đó, việc nhận biết và giải thích tính không đồng nhất là một phần của việc đánh giá một phân tích tổng hợp. Mục này giải thích cách tính không đồng nhất được đo lường và sử dụng trong phân tích; nó không phải là hướng dẫn cho bất kỳ quyết định lâm sàng cá nhân nào.
Epidemiology
Các thống kê về tính không đồng nhất, đặc biệt là I-squared và tau-squared, được báo cáo theo tiêu chuẩn trong các phân tích tổng hợp trên y học và y tế công cộng, và hầu hết phần mềm phân tích tổng hợp đều tự động tính toán chúng. Thống kê I-squared do Higgins và Thompson giới thiệu là một trong những đại lượng được báo cáo rộng rãi nhất trong tài liệu tổng hợp, mặc dù cách giải thích của nó thường xuyên được tranh luận.
History
Thử nghiệm Cochran's Q, bắt nguồn từ công trình của William Cochran vào giữa thế kỷ XX, là tiêu chuẩn ban đầu để phát hiện tính không đồng nhất nhưng được công nhận là có công suất kém và phụ thuộc vào thang đo. DerSimonian và Laird (1986) đã chính thức hóa phương pháp hiệu ứng ngẫu nhiên kết hợp phương sai giữa các nghiên cứu. Higgins và Thompson (2002) sau đó đã đề xuất thống kê I-squared để thể hiện tính không đồng nhất dưới dạng tỷ lệ độc lập với số lượng nghiên cứu, và bài báo BMJ năm 2003 của họ đã phổ biến nó, sau đó I-squared trở thành một phần thường xuyên trong báo cáo phân tích tổng hợp.
Debates
- Nên giải thích I-squared như thế nào?
- Các ngưỡng quy tắc ngón tay cái phổ biến cho tính không đồng nhất thấp, trung bình và cao được sử dụng rộng rãi nhưng không bao giờ được coi là các điểm cắt cứng nhắc; I-squared phụ thuộc vào độ chính xác của các nghiên cứu được đưa vào và có thể gây hiểu lầm khi số lượng nghiên cứu ít hoặc rất lớn.
Key figures
- Julian Higgins
- Simon Thompson
- Rebecca DerSimonian
- Nan Laird
- William Cochran
Related topics
Seminal works
- higgins-2003-i2
- higgins-2002-quantifying
- dersimonian-laird-1986
Frequently asked questions
- Sự khác biệt giữa tính không đồng nhất lâm sàng và thống kê là gì?
- Tính không đồng nhất lâm sàng (và phương pháp luận) đề cập đến những khác biệt thực sự giữa các nghiên cứu về quần thể, can thiệp hoặc thiết kế của chúng. Tính không đồng nhất thống kê là sự biến thiên kết quả trong các ước tính hiệu ứng của chúng vượt quá sự ngẫu nhiên, được đo bằng các thống kê như I-squared và tau-squared. Sự khác biệt lâm sàng thường là lời giải thích cho tính không đồng nhất thống kê được quan sát.
- I-squared cao có nghĩa là một phân tích tổng hợp không hợp lệ không?
- Không phải tự nó. I-squared cao báo hiệu rằng các hiệu ứng khác nhau giữa các nghiên cứu và một tóm tắt duy nhất nên được giải thích một cách thận trọng, thường thúc đẩy một mô hình hiệu ứng ngẫu nhiên, khám phá các nguồn hoặc một khoảng dự đoán. Đó là một dấu hiệu để giải thích, không phải là một sự loại bỏ tự động.