Tổng hợp bằng chứng và Đánh giá phê bình
Tổng hợp bằng chứng là quá trình định vị, lựa chọn và kết hợp một cách có hệ thống các kết quả của các nghiên cứu ban đầu thành một bản tóm tắt mạch lạc, nghiêm ngặt nhất thông qua các tổng quan hệ thống và, nếu phù hợp, phân tích tổng hợp (meta-analysis). Đánh giá phê bình là việc đánh giá có cấu trúc về tính hợp lệ, kết quả và khả năng áp dụng của một nghiên cứu hoặc tổng quan. Cùng với nhau, chúng cho phép các nhà vật lý trị liệu đánh giá mức độ đáng tin cậy của bằng chứng hiện có và mức độ áp dụng của chúng cho bệnh nhân của họ.
Definition
Tổng hợp bằng chứng là việc xác định, đánh giá và kết hợp có hệ thống các nghiên cứu liên quan thành một bản tóm tắt tổng thể về những gì đã biết, và đánh giá phê bình là việc đánh giá rõ ràng, có cấu trúc về tính hợp lệ, mức độ, độ chính xác và khả năng áp dụng của các phát hiện nghiên cứu.
Scope
Mục này bao gồm các tổng quan hệ thống và phân tích tổng hợp như các phương pháp tổng hợp, các tiêu chuẩn báo cáo như PRISMA, các công cụ để đánh giá chất lượng nghiên cứu và nguy cơ sai lệch, và các khuôn khổ như GRADE để xếp hạng mức độ chắc chắn của bằng chứng. Đây là một chủ đề về phương pháp luận, về cách bằng chứng được tóm tắt và đánh giá, không phải là nguồn cung cấp các khuyến nghị lâm sàng hoặc lời khuyên điều trị.
Core questions
- Các tổng quan hệ thống và phân tích tổng hợp được thực hiện và báo cáo như thế nào?
- Nguy cơ sai lệch trong một nghiên cứu hoặc tổng quan được đánh giá như thế nào?
- Mức độ chắc chắn tổng thể của một tập hợp bằng chứng được xếp hạng như thế nào?
- Một bác sĩ lâm sàng đánh giá bằng chứng có áp dụng cho một bệnh nhân cụ thể như thế nào?
Key concepts
- Tổng quan hệ thống
- Phân tích tổng hợp và ước tính hiệu quả tổng hợp
- Nguy cơ sai lệch và chất lượng nghiên cứu
- Tiêu chuẩn báo cáo PRISMA
- Thang điểm PEDro để đánh giá các thử nghiệm
- Mức độ chắc chắn của bằng chứng GRADE
- Tính không đồng nhất
- Sai lệch xuất bản
- Khả năng áp dụng và giá trị bên ngoài
Key theories
- Tổng quan hệ thống và phân tích tổng hợp
- Một phương pháp sử dụng giao thức được xác định trước, tìm kiếm toàn diện, lựa chọn rõ ràng và đánh giá nguy cơ sai lệch, và — khi các nghiên cứu đủ tương tự — tổng hợp thống kê để tạo ra một bản tổng hợp bằng chứng minh bạch, có thể tái lập.
- Khuôn khổ mức độ chắc chắn của bằng chứng GRADE
- Một cách tiếp cận có cấu trúc để xếp hạng mức độ chắc chắn của một tập hợp bằng chứng cho mỗi kết quả (từ cao đến rất thấp) bằng cách xem xét nguy cơ sai lệch, tính không nhất quán, tính gián tiếp, tính không chính xác và sai lệch xuất bản, tách biệt mức độ chắc chắn khỏi sức mạnh của bất kỳ khuyến nghị nào.
Mechanisms
Một tổng quan hệ thống bắt đầu từ một câu hỏi và giao thức tập trung, tìm kiếm toàn diện, sàng lọc các nghiên cứu dựa trên các tiêu chí rõ ràng và đánh giá từng nghiên cứu về nguy cơ sai lệch; tuyên bố PRISMA quy định những gì nên được báo cáo ở mỗi bước để quá trình này minh bạch và có thể tái lập. Khi các nghiên cứu được đưa vào đủ tương tự, phân tích tổng hợp sẽ tổng hợp các ước tính hiệu quả của chúng thành một bản tóm tắt có trọng số, với đánh giá thống kê về tính không đồng nhất. Đánh giá phê bình các nghiên cứu riêng lẻ sử dụng các công cụ có cấu trúc — trong vật lý trị liệu, thang điểm PEDro đánh giá chất lượng phương pháp luận của các thử nghiệm ngẫu nhiên — và khuôn khổ GRADE sau đó đánh giá mức độ chắc chắn của bằng chứng kết hợp cho mỗi kết quả. Khả năng áp dụng được đánh giá riêng: ngay cả bằng chứng hợp lệ cũng phải phù hợp với đặc điểm và bối cảnh của bệnh nhân để đưa ra quyết định.
Clinical relevance
Tổng hợp và đánh giá cho phép các nhà vật lý trị liệu cân nhắc các tuyên bố cạnh tranh và tránh bị lừa dối bởi các nghiên cứu đơn lẻ hoặc các báo cáo sai lệch, hỗ trợ yếu tố bằng chứng nghiên cứu của thực hành dựa trên bằng chứng. Mục này mô tả cách bằng chứng được tóm tắt và đánh giá; nó mang tính giáo dục và bản thân nó không khuyến nghị hoặc đánh giá bất kỳ can thiệp cụ thể nào cho bệnh nhân.
Evidence & guidelines
Việc báo cáo các tổng quan hệ thống được điều chỉnh bởi tuyên bố PRISMA, ban đầu được xuất bản vào năm 2009 và được cập nhật thành PRISMA 2020 (Page và cộng sự), trong khi mức độ chắc chắn của bằng chứng được đánh giá rộng rãi bằng GRADE (Guyatt và cộng sự, 2008). Trong vật lý trị liệu, thang điểm PEDro (Maher và cộng sự, 2003) là một công cụ tiêu chuẩn để đánh giá chất lượng của các thử nghiệm đối chứng ngẫu nhiên, và cơ sở dữ liệu PEDro lập chỉ mục các thử nghiệm và tổng quan đã được đánh giá.
History
Phân tích tổng hợp và tổng quan hệ thống phát triển trong suốt cuối thế kỷ XX, được thể chế hóa bởi Hợp tác Cochrane từ năm 1993. Các tiêu chuẩn báo cáo tiếp theo: QUOROM và sau đó là PRISMA vào năm 2009, được cập nhật vào năm 2020. Nhóm làm việc GRADE đã chính thức hóa việc xếp hạng mức độ chắc chắn vào những năm 2000, và vật lý trị liệu đã đóng góp các công cụ chuyên biệt theo lĩnh vực như thang điểm và cơ sở dữ liệu PEDro để làm cho việc đánh giá các thử nghiệm phục hồi chức năng trở nên có hệ thống.
Debates
- Khi nào các nghiên cứu nên được tổng hợp trong một phân tích tổng hợp?
- Việc kết hợp các nghiên cứu không đồng nhất có thể tạo ra một bản tóm tắt chính xác nhưng gây hiểu lầm; việc quyết định khi nào tính không đồng nhất lâm sàng và thống kê ngăn cản việc tổng hợp, và cách xử lý nó, vẫn là một phán đoán phương pháp luận trung tâm.
- Mức độ chắc chắn của bằng chứng nên được phân biệt với sức mạnh của khuyến nghị như thế nào?
- GRADE cố tình tách biệt mức độ chắc chắn của bằng chứng với mức độ mạnh của khuyến nghị, bởi vì các giá trị, sở thích và sự đánh đổi cũng ảnh hưởng đến các khuyến nghị; việc áp dụng sự phân biệt này một cách nhất quán là một thách thức đang diễn ra.
Key figures
- David Moher
- Matthew Page
- Gordon Guyatt
- Christopher Maher
- David Sackett
Related topics
Seminal works
- moher-2009
- page-2021
- guyatt-2008-grade
Frequently asked questions
- Sự khác biệt giữa tổng quan hệ thống và phân tích tổng hợp là gì?
- Tổng quan hệ thống sử dụng các phương pháp rõ ràng, có thể tái lập để tìm kiếm, đánh giá và tóm tắt các nghiên cứu; phân tích tổng hợp là bước thống kê tùy chọn trong một số tổng quan, tổng hợp kết quả của các nghiên cứu thành một ước tính có trọng số duy nhất khi chúng đủ tương tự.
- Tại sao đánh giá phê bình lại cần thiết nếu một nghiên cứu đã được xuất bản?
- Việc xuất bản không đảm bảo tính hợp lệ; đánh giá sẽ đánh giá nguy cơ sai lệch, độ chính xác và quy mô của các hiệu ứng, và liệu các phát hiện có áp dụng cho một bệnh nhân cụ thể hay không, để các kết luận được cân nhắc theo độ tin cậy của chúng.