Đánh giá phê bình và Đánh giá bằng chứng cá nhân
Đánh giá phê bình là quá trình có cấu trúc nhằm kiểm tra một cách có hệ thống một công trình nghiên cứu đơn lẻ để đánh giá tính hợp lệ, quy mô và độ chính xác của kết quả, cũng như mức độ liên quan của nó đối với một câu hỏi nhất định. Đây là kỹ năng thực hành biến việc đọc một nghiên cứu thành việc đánh giá một nghiên cứu, và nó nằm ở trung tâm của thực hành dựa trên bằng chứng: trước khi bằng chứng có thể được áp dụng hoặc tổng hợp, mỗi nghiên cứu trước tiên phải được đánh giá theo các tiêu chí riêng của nó.
Definition
Đánh giá phê bình là việc đánh giá rõ ràng, dựa trên tiêu chí của một nghiên cứu riêng lẻ để xác định độ tin cậy của các phương pháp (tính hợp lệ nội bộ), ý nghĩa và độ chính xác của các phát hiện, và mức độ mà các phát hiện đó có thể được áp dụng cho các bối cảnh hoặc quần thể khác (tính hợp lệ bên ngoài).
Scope
Lĩnh vực này định hướng cho người đọc về cách các nghiên cứu riêng lẻ được đánh giá thay vì cách các tập hợp bằng chứng được tổng hợp. Nó bao gồm các câu hỏi đánh giá chung (nó có hợp lệ không? kết quả là gì? chúng có áp dụng được không?), các công cụ và danh mục kiểm tra có cấu trúc được sử dụng để áp dụng các câu hỏi đó, và các tiêu chuẩn báo cáo (như CONSORT và STROBE) giúp một nghiên cứu đủ minh bạch để đánh giá ngay từ đầu. Đây là tài liệu tham khảo-giáo dục và không cung cấp các khuyến nghị lâm sàng.
Sub-topics
Core questions
- Kết quả của nghiên cứu riêng lẻ này có hợp lệ không, dựa trên cách nó được thiết kế và thực hiện?
- Kết quả là gì, và chúng chính xác và quan trọng về mặt lâm sàng hoặc thực tiễn đến mức nào?
- Kết quả có thể được áp dụng cho quần thể, bối cảnh hoặc câu hỏi đang được xem xét không?
- Các công cụ có cấu trúc và tiêu chuẩn báo cáo giúp một nghiên cứu có thể đánh giá được và giảm thiểu sự đánh giá chủ quan như thế nào?
Key concepts
- Tính hợp lệ nội bộ
- Tính hợp lệ bên ngoài (khả năng khái quát hóa)
- Nguy cơ sai lệch
- Khung đánh giá tính hợp lệ-kết quả-khả năng áp dụng
- Tiêu chuẩn báo cáo so với chất lượng phương pháp luận
- Các công cụ và danh mục kiểm tra đánh giá phê bình
- Khả năng tái tạo và tính minh bạch của báo cáo
Mechanisms
Đánh giá tiến hành bằng cách đối chiếu thiết kế của một nghiên cứu với các sai lệch mà thiết kế đó dễ mắc phải, sau đó đặt câu hỏi liệu các tác giả có thực hiện các bước đầy đủ để chống lại chúng hay không. Khung Hướng dẫn dành cho Người dùng được giảng dạy rộng rãi tổ chức điều này thành ba câu hỏi tuần tự — kết quả có hợp lệ không, kết quả là gì và liệu chúng có giúp ích tại địa phương không — để việc đánh giá tính hợp lệ đi trước việc giải thích kích thước hiệu ứng, điều này đến lượt nó đi trước bất kỳ đánh giá nào về khả năng áp dụng (Guyatt 1993; Greenhalgh 1997). Khác với việc đánh giá các phương pháp, các tiêu chuẩn báo cáo quy định những gì một bài báo phải tiết lộ để người đọc có thông tin cần thiết để đánh giá nó; hai điều này bổ sung cho nhau, bởi vì một nghiên cứu được thực hiện tốt nhưng được báo cáo kém thì không thể đánh giá được, và một nghiên cứu được báo cáo minh bạch vẫn có thể bị đánh giá là có nguy cơ sai lệch cao.
Clinical relevance
Đánh giá phê bình là một năng lực cốt lõi của thực hành dựa trên bằng chứng trong tất cả các ngành nghề y tế, bởi vì việc áp dụng nghiên cứu một cách có trách nhiệm đòi hỏi trước tiên phải đánh giá xem một nghiên cứu có đáng tin cậy và phù hợp hay không. Lĩnh vực này mô tả cách các nghiên cứu riêng lẻ được đánh giá và báo cáo; nó đặc trưng cho bằng chứng hơn là đưa ra các quyết định chẩn đoán hoặc điều trị, và nó không phải là sự thay thế cho các hướng dẫn lâm sàng.
Evidence & guidelines
Đánh giá được hỗ trợ bởi các công cụ đã được xác nhận, cụ thể theo thiết kế hơn là một danh mục kiểm tra phổ quát duy nhất; một đánh giá hệ thống đã tìm thấy sự biến thiên rộng rãi giữa hơn một trăm công cụ đã xuất bản mà không có tiêu chuẩn vàng được thống nhất cho bất kỳ thiết kế nào (Katrak 2004). Các tiêu chuẩn báo cáo được các tạp chí và Mạng lưới EQUATOR — CONSORT cho các thử nghiệm ngẫu nhiên và STROBE cho các nghiên cứu quan sát — bổ sung cho việc đánh giá bằng cách chuẩn hóa việc tiết lộ, trong khi các khung như GRADE mở rộng việc đánh giá từ nghiên cứu đơn lẻ đến độ chắc chắn của một tập hợp bằng chứng (Guyatt 2008).
History
Đánh giá phê bình có cấu trúc phát triển từ dịch tễ học lâm sàng được phát triển tại Đại học McMaster và phong trào y học dựa trên bằng chứng của những năm 1990. Định nghĩa của Sackett và các đồng nghiệp về y học dựa trên bằng chứng đã định hình việc đánh giá các nghiên cứu riêng lẻ như một kỹ năng lâm sàng thường xuyên (Sackett 1996), và loạt Hướng dẫn dành cho Người dùng của JAMA đã mã hóa các câu hỏi đánh giá rõ ràng, tuần tự cho từng loại nghiên cứu (Guyatt 1993). Các tài liệu hướng dẫn được đọc rộng rãi của Greenhalgh đã mang cùng một phương pháp tiếp cận đến một đối tượng lâm sàng rộng lớn (Greenhalgh 1997). Song song đó, các tiêu chuẩn báo cáo và các công cụ đánh giá chuyên dụng đã phát triển mạnh mẽ từ cuối những năm 1990 trở đi, cuối cùng được điều phối thông qua Mạng lưới EQUATOR.
Debates
- Chất lượng báo cáo có đo lường chất lượng nghiên cứu không?
- Các tiêu chuẩn báo cáo ghi lại những gì đã được tiết lộ, không phải liệu nghiên cứu có được thực hiện tốt hay không; việc coi việc tuân thủ một danh mục kiểm tra báo cáo là một thước đo chất lượng phương pháp luận đã làm lẫn lộn tính minh bạch với tính hợp lệ, và hầu hết các tác giả tiêu chuẩn đều cảnh báo không nên sử dụng chúng làm điểm chất lượng.
- Có công cụ đánh giá tiêu chuẩn vàng nào không?
- Số lượng lớn các danh mục kiểm tra cạnh tranh, với ít sự trùng lặp về nội dung và không có công cụ tham chiếu được thống nhất cho bất kỳ thiết kế nào, khiến việc đánh giá một phần phụ thuộc vào công cụ được chọn và vào phán đoán của người đánh giá.
Key figures
- David Sackett
- Gordon Guyatt
- Trisha Greenhalgh
- Andrew Oxman
Related topics
Seminal works
- sackett-1996
- guyatt-1993
- greenhalgh-1997
Frequently asked questions
- Đánh giá phê bình khác với tổng hợp bằng chứng như thế nào?
- Đánh giá phê bình đánh giá từng nghiên cứu một, đánh giá tính hợp lệ và mức độ liên quan của nó. Tổng hợp bằng chứng kết hợp các phát hiện của nhiều nghiên cứu đã được đánh giá; đánh giá từng nghiên cứu riêng lẻ là một bước tiên quyết trong tổng hợp.
- Việc tuân theo danh mục kiểm tra báo cáo có giống như đánh giá một nghiên cứu không?
- Không. Các tiêu chuẩn báo cáo cho bạn biết liệu một nghiên cứu có tiết lộ đủ thông tin hay không; đánh giá sử dụng thông tin đó để đánh giá xem các phương pháp và kết quả của nghiên cứu có thể được tin cậy và áp dụng hay không. Một nghiên cứu được báo cáo đầy đủ vẫn có thể có nguy cơ sai lệch cao.