Thứ bậc bằng chứng
Thứ bậc bằng chứng là một cách sắp xếp các thiết kế nghiên cứu theo thứ tự về mức độ mà mỗi thiết kế có thể hỗ trợ các suy luận về hiệu quả của một can thiệp, với các thiết kế được đặt ở vị trí cao hơn khi chúng, về nguyên tắc, ít bị sai lệch hệ thống hơn. Thường được hình dung như một kim tự tháp, nó đặt các thử nghiệm đối chứng ngẫu nhiên và các tổng hợp của chúng lên trên các nghiên cứu quan sát, mà đến lượt mình lại xếp trên các chuỗi ca bệnh và ý kiến chuyên gia.
Definition
Thứ bậc bằng chứng là một phân loại xếp hạng các thiết kế nghiên cứu từ những thiết kế ít có khả năng bị sai lệch nhất đối với các câu hỏi nhân quả (tổng quan hệ thống các thử nghiệm ngẫu nhiên) đến những thiết kế dễ bị sai lệch nhất (báo cáo ca bệnh và ý kiến chuyên gia), được sử dụng như một phương pháp phỏng đoán ban đầu về sức mạnh của bằng chứng.
Scope
Mục này giải thích lý do để xếp hạng các thiết kế theo mức độ dễ bị sai lệch, kim tự tháp cổ điển và các tầng của nó, cũng như những phê bình hiện đại đã định hình lại nó. Đây là một tài liệu tham khảo về phương pháp luận về cách thiết kế ảnh hưởng đến độ tin cậy, không phải là một bộ quy tắc để lựa chọn chăm sóc.
Key concepts
- Các cấp độ bằng chứng
- Kim tự tháp bằng chứng
- Thử nghiệm đối chứng ngẫu nhiên ở đỉnh của các thiết kế sơ cấp
- Các thiết kế quan sát (nghiên cứu đoàn hệ, nghiên cứu bệnh chứng)
- Chuỗi ca bệnh và ý kiến chuyên gia ở đáy
- Mức độ dễ bị sai lệch là nguyên tắc sắp xếp
- Thứ hạng thiết kế như một phương pháp phỏng đoán, không phải là sự đảm bảo
Mechanisms
Nguyên tắc sắp xếp là mức độ dễ bị lỗi hệ thống: ngẫu nhiên hóa bảo vệ chống lại các yếu tố gây nhiễu bằng cách phân phối các yếu tố đã biết và chưa biết đều khắp các nhóm, do đó các thử nghiệm ngẫu nhiên đứng trên các thiết kế quan sát đối với các câu hỏi về hiệu quả điều trị. Các tổng hợp (tổng quan hệ thống và phân tích tổng hợp) của các nghiên cứu như vậy còn đứng cao hơn nữa vì chúng tổng hợp và đánh giá các bằng chứng sơ cấp có sẵn. Các tầng thấp hơn, chẳng hạn như chuỗi ca bệnh và ý kiến chuyên gia, thiếu các nhóm so sánh hoặc thu thập dữ liệu có hệ thống. Điều quan trọng là, thứ hạng phản ánh rủi ro sai lệch điển hình của thiết kế, không phải cách thực hiện của bất kỳ nghiên cứu cụ thể nào; một thử nghiệm được thực hiện kém có thể ít đáng tin cậy hơn một nghiên cứu quan sát nghiêm ngặt.
Clinical relevance
Thứ bậc là một phương pháp phỏng đoán ban đầu để đọc tài liệu: nó báo hiệu những thiết kế nào thường cung cấp bằng chứng mạnh mẽ hơn cho các câu hỏi về hiệu quả và giúp định hình lý do tại sao các hội đồng hướng dẫn đánh giá một số nghiên cứu nặng hơn. Nó mô tả cách đánh giá sức mạnh bằng chứng và bản thân nó không quy định bất kỳ hành động lâm sàng nào.
Evidence & guidelines
Các thứ bậc ban đầu được chính thức hóa trong Hướng dẫn sử dụng tài liệu y khoa (Users' Guides to the Medical Literature) và các sơ đồ phân loại liên quan (Guyatt et al., 1995), sau đó được tiếp thu vào các khung công tác tập trung vào kết quả hơn như GRADE (Guyatt et al., 2008). Concato et al. (2000) đã thách thức giả định rằng các nghiên cứu quan sát vốn dĩ kém tin cậy hơn, và Murad et al. (2016) đã đề xuất một kim tự tháp sửa đổi trong đó các tổng quan hệ thống đóng vai trò như một thấu kính được áp dụng cho các tầng thiết kế chứ không phải là một lớp riêng biệt ở trên cùng.
History
Việc xếp hạng các thiết kế theo độ tin cậy xuất hiện cùng với dịch tễ học lâm sàng vào những năm 1970-1980 và được phổ biến thông qua y học dựa trên bằng chứng vào những năm 1990, bao gồm các cấp độ bằng chứng của Lực lượng đặc nhiệm Canada và các cấp độ của Trung tâm Y học dựa trên bằng chứng Oxford. Hình ảnh kim tự tháp quen thuộc đã đi vào giảng dạy như một sự đơn giản hóa. Từ khoảng năm 2000, các học giả đã đặt câu hỏi về việc xếp hạng cứng nhắc, và phong trào GRADE cùng các kim tự tháp sửa đổi đã chuyển trọng tâm từ thứ hạng thiết kế sang sự chắc chắn của bằng chứng cho các kết quả cụ thể.
Debates
- Liệu thứ hạng thiết kế có phóng đại sự thua kém của các nghiên cứu quan sát không?
- Concato và các đồng nghiệp lập luận rằng các nghiên cứu quan sát được thiết kế tốt thường cho ra các ước tính tương tự như các thử nghiệm ngẫu nhiên, vì vậy việc coi chúng là yếu hơn một cách rõ ràng có thể gây hiểu lầm; thứ hạng là một phương pháp phỏng đoán, không phải là một phán quyết về bất kỳ nghiên cứu cá nhân nào.
- Có nên vẽ lại kim tự tháp không?
- Các kim tự tháp sửa đổi đã định hình lại các tổng quan hệ thống như một thấu kính được áp dụng trên các tầng thiết kế và làm mờ ranh giới giữa các cấp độ liền kề, phản ánh rằng cách thực hiện và sự chắc chắn, chứ không chỉ riêng thiết kế, quyết định độ tin cậy.
Key figures
- David Sackett
- Gordon Guyatt
- John Concato
- M. Hassan Murad
Related topics
Seminal works
- sackett-1996
- concato-2000
- murad-2016-pyramid
Frequently asked questions
- Vị trí cao hơn trong thứ bậc có đảm bảo kết quả đáng tin cậy hơn không?
- Không. Thứ bậc xếp hạng các thiết kế theo mức độ dễ bị sai lệch điển hình của chúng, nhưng một nghiên cứu có thứ hạng cao vẫn có thể được thực hiện kém; độ tin cậy phụ thuộc vào cách một nghiên cứu thực sự được thực hiện, điều này được đánh giá bằng cách đánh giá rủi ro sai lệch.
- Tại sao các tổng quan hệ thống thường được đặt ở đỉnh của kim tự tháp?
- Bởi vì chúng thu thập, đánh giá và tổng hợp một cách có hệ thống các nghiên cứu sơ cấp liên quan; các kim tự tháp sửa đổi coi chúng như một thấu kính được áp dụng cho các thiết kế cơ bản chứ không phải là một tầng hoàn toàn riêng biệt.