Đánh giá xét nghiệm sàng lọc và chẩn đoán
Đánh giá xét nghiệm sàng lọc và chẩn đoán là một nhánh của dịch tễ học định lượng mức độ một xét nghiệm có thể phân biệt những người mắc bệnh mục tiêu với những người không mắc bệnh. Nó cung cấp các thước đo — độ nhạy, độ đặc hiệu, giá trị tiên đoán, tỷ số khả dĩ và đường cong đặc trưng hoạt động của bộ thu — được sử dụng để đánh giá một xét nghiệm so với tiêu chuẩn tham chiếu và dự đoán cách nó sẽ hoạt động khi áp dụng cho một quần thể.
Definition
Đánh giá xét nghiệm sàng lọc và chẩn đoán là việc đo lường có hệ thống khả năng của một xét nghiệm trong việc phân loại đối tượng theo tình trạng bệnh thực sự, được thể hiện thông qua các chỉ số độ chính xác được tính toán từ bảng phân loại chéo kết quả xét nghiệm so với tiêu chuẩn tham chiếu.
Scope
Lĩnh vực này định hướng người đọc đến các chỉ số độ chính xác cốt lõi được rút ra từ việc so sánh một xét nghiệm với tiêu chuẩn tham chiếu ("vàng"), sự phân biệt giữa các đặc tính nội tại của xét nghiệm và hiệu suất tiên đoán phụ thuộc vào quần thể, vai trò của tỷ lệ hiện mắc bệnh, và các tiêu chuẩn báo cáo cho các nghiên cứu độ chính xác chẩn đoán. Đây là một tổng quan về phương pháp luận, không phải hướng dẫn lâm sàng, và không khuyến nghị bất kỳ xét nghiệm hoặc ngưỡng cụ thể nào cho một cá nhân.
Sub-topics
Core questions
- Một xét nghiệm thường xuyên xác định đúng những người mắc bệnh và những người không mắc bệnh như thế nào?
- Với kết quả dương tính hoặc âm tính, khả năng tình trạng bệnh thực sự hiện diện hoặc không hiện diện là bao nhiêu?
- Tỷ lệ hiện mắc bệnh trong một quần thể thay đổi giá trị thực tế của một xét nghiệm như thế nào?
- Nên chọn và báo cáo sự đánh đổi giữa việc phát hiện các trường hợp thực sự và tránh các cảnh báo sai như thế nào?
Key concepts
- Tiêu chuẩn tham chiếu (vàng)
- Độ nhạy và độ đặc hiệu
- Giá trị tiên đoán dương tính và âm tính
- Tỷ số khả dĩ
- Tỷ lệ hiện mắc bệnh và xác suất trước xét nghiệm
- Đường cong đặc trưng hoạt động của bộ thu (ROC)
- Ngưỡng chẩn đoán và điểm cắt
- Sai lệch phổ và sai lệch xác minh
Mechanisms
Đánh giá xét nghiệm bắt đầu bằng cách phân loại chéo kết quả xét nghiệm của mỗi đối tượng (dương tính hoặc âm tính) so với tình trạng bệnh thực sự được xác định bởi một tiêu chuẩn tham chiếu, tạo ra bốn ô của bảng 2x2 (dương tính thật, dương tính giả, âm tính giả, âm tính thật). Độ nhạy và độ đặc hiệu được đọc theo các cột của tình trạng bệnh đã biết và về nguyên tắc, là các đặc tính của xét nghiệm không phụ thuộc vào mức độ phổ biến của tình trạng bệnh. Các giá trị tiên đoán được đọc theo các hàng của kết quả xét nghiệm và do đó phụ thuộc vào tỷ lệ hiện mắc, bởi vì cùng một xét nghiệm được áp dụng khi bệnh hiếm gặp sẽ cho nhiều dương tính giả hơn so với dương tính thật. Tỷ số khả dĩ kết hợp độ nhạy và độ đặc hiệu thành các yếu tố cập nhật tỷ lệ cược trước xét nghiệm thành tỷ lệ cược sau xét nghiệm. Khi một xét nghiệm tạo ra một phép đo liên tục hoặc thứ tự, việc di chuyển ngưỡng quyết định sẽ đánh đổi độ nhạy với độ đặc hiệu; vẽ biểu đồ sự đánh đổi đó trên tất cả các ngưỡng sẽ tạo ra đường cong ROC, diện tích của nó tóm tắt khả năng phân biệt độc lập với bất kỳ điểm cắt nào.
Clinical relevance
Các thước đo này là ngôn ngữ chung để đánh giá liệu một xét nghiệm sàng lọc hoặc chẩn đoán có phù hợp với mục đích hay không và để so sánh các xét nghiệm cạnh tranh trên cơ sở bình đẳng. Hiểu chúng là trọng tâm của việc đánh giá phê bình các tài liệu chẩn đoán; lĩnh vực này giải thích cách bằng chứng chẩn đoán được tạo ra và diễn giải và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
Epidemiology
Các chỉ số độ chính xác là nền tảng cho các quyết định về chương trình sàng lọc quần thể, nơi hậu quả của dương tính giả và âm tính giả trên quy mô lớn, cùng với tỷ lệ hiện mắc bệnh, xác định liệu sàng lọc có mang lại nhiều lợi ích hơn là tác hại. Các tiêu chuẩn báo cáo như STARD được phát triển để cải thiện tính đầy đủ và minh bạch của các nghiên cứu độ chính xác chẩn đoán, và các sai lệch về phổ và xác minh được công nhận là các mối đe dọa đối với tính hợp lệ của độ chính xác được báo cáo.
Evidence & guidelines
Tuyên bố STARD cung cấp danh mục kiểm tra để báo cáo minh bạch các nghiên cứu độ chính xác chẩn đoán và được các tạp chí y sinh học ủng hộ rộng rãi.
History
Đánh giá chính thức các xét nghiệm chẩn đoán phát triển từ công trình giữa thế kỷ XX về phát hiện tín hiệu và ra quyết định lâm sàng và được làm rõ hơn nhờ sự công nhận vào những năm 1970 rằng thiết kế nghiên cứu sai lệch có thể làm tăng độ chính xác biểu kiến. Các thước đo độ chính xác dễ tiếp cận đã được phổ biến trong các tài liệu y học trong suốt những năm 1990, và các tiêu chuẩn báo cáo đã được củng cố trong tuyên bố STARD vào những năm 2000 và được cập nhật vào năm 2015.
Debates
- Tại sao một xét nghiệm có vẻ rất chính xác vẫn có thể gây hiểu lầm trong sàng lọc?
- Bởi vì các giá trị tiên đoán phụ thuộc vào tỷ lệ hiện mắc, một xét nghiệm có độ nhạy và độ đặc hiệu cao vẫn có thể tạo ra nhiều dương tính giả khi áp dụng cho một quần thể sàng lọc có tỷ lệ hiện mắc thấp, đây là một nguồn gây hiểu lầm thường xuyên.
- Các sai lệch trong thiết kế nghiên cứu làm sai lệch độ chính xác được báo cáo đến mức nào?
- Sai lệch phổ và sai lệch xác minh có thể làm tăng đáng kể độ nhạy và độ đặc hiệu được đo lường, vì vậy độ chính xác được báo cáo phải được diễn giải dựa trên cách chọn các trường hợp và đối chứng và cách áp dụng tiêu chuẩn tham chiếu.
Key figures
- Douglas Altman
- Jonathan Deeks
- David Grimes
- Kenneth Schulz
- Patrick Bossuyt
Related topics
Seminal works
- ransohoff-feinstein-1978
- altman-bland-1994a
- altman-bland-1994b
- bossuyt-2015
Frequently asked questions
- Sự khác biệt giữa xét nghiệm sàng lọc và xét nghiệm chẩn đoán là gì?
- Xét nghiệm sàng lọc được áp dụng cho những người khỏe mạnh rõ ràng để xác định những người có nhiều khả năng mắc bệnh, thường ưu tiên độ nhạy, trong khi xét nghiệm chẩn đoán được sử dụng để xác nhận hoặc loại trừ bệnh ở những người đã nghi ngờ mắc bệnh; cả hai đều được đánh giá bằng các thước đo độ chính xác giống nhau so với tiêu chuẩn tham chiếu.
- Tại sao tỷ lệ hiện mắc lại quan trọng đối với tính hữu ích của một xét nghiệm?
- Độ nhạy và độ đặc hiệu mô tả bản thân xét nghiệm, nhưng khả năng một kết quả dương tính là đúng (giá trị tiên đoán dương tính) giảm khi tình trạng bệnh trở nên hiếm hơn, vì vậy cùng một xét nghiệm có thể cung cấp thông tin trong một phòng khám có tỷ lệ hiện mắc cao và gây hiểu lầm trong một môi trường sàng lọc có tỷ lệ hiện mắc thấp.