Tarama ve Tanı Testi Değerlendirmesi
Tarama ve tanı testi değerlendirmesi, bir testin hedef durumu olan kişileri olmayanlardan ne kadar iyi ayırt ettiğini nicel olarak belirleyen epidemiyolojinin bir dalıdır. Bir testi referans standarda göre değerlendirmek ve bir popülasyona uygulandığında nasıl davranacağını öngörmek için kullanılan duyarlılık, özgüllük, prediktif değerler, olabilirlik oranları ve alıcı işletim karakteristiği eğrisi gibi ölçütleri sunmaktadır.
Tanım
Tarama ve tanı testi değerlendirmesi, bir testin denekleri gerçek hastalık durumuna göre sınıflandırma yeteneğinin, test sonuçlarının bir referans standarda göre çapraz tablolandırılmasından hesaplanan doğruluk indeksleri aracılığıyla sistematik olarak ölçülmesidir.
Kapsam
Bu alan, okuyucuyu bir testin referans ("altın") standarda göre karşılaştırılmasından elde edilen temel doğruluk ölçütlerine, testin içsel özellikleri ile popülasyona bağlı prediktif performans arasındaki ayrıma, hastalık prevalansının rolüne ve tanısal doğruluk çalışmalarına yönelik raporlama standartlarına yönlendirmektedir. Bu bir metodolojik genel bakış olup, klinik bir rehberlik niteliği taşımamaktadır ve bireyler için belirli bir test veya eşik önermemektedir.
Alt konular
Temel sorular
- Bir test, durumu olan kişileri ve olmayan kişileri ne sıklıkla doğru bir şekilde tanımlar?
- Pozitif veya negatif bir sonuç verildiğinde, durumun gerçekten mevcut veya yok olma olasılığı nedir?
- Bir popülasyondaki durumun prevalansı, bir testin pratik değerini nasıl değiştirir?
- Gerçek vakaları tespit etme ile yanlış alarmlardan kaçınma arasındaki denge nasıl seçilmeli ve raporlanmalıdır?
Anahtar kavramlar
- Referans (altın) standart
- Duyarlılık ve özgüllük
- Pozitif ve negatif prediktif değer
- Olabilirlik oranları
- Hastalık prevalansı ve test öncesi olasılık
- Alıcı işletim karakteristiği (ROC) eğrisi
- Tanı eşiği ve kesme noktası
- Spektrum ve doğrulama yanlılığı
Mekanizmalar
Test değerlendirmesi, her denek için test sonucunun (pozitif veya negatif) bir referans standartla belirlenen gerçek hastalık durumuna göre çapraz sınıflandırılmasıyla başlar; böylece 2x2'lik bir tablonun dört hücresi (gerçek pozitifler, yanlış pozitifler, yanlış negatifler, gerçek negatifler) elde edilir. Duyarlılık ve özgüllük, bilinen hastalık durumunun sütunlarından okunur ve prensipte, durumun ne kadar yaygın olduğuna bağlı olmayan test özellikleridir. Prediktif değerler, test sonucunun satırları boyunca okunur ve bu nedenle prevalansa bağlıdır; çünkü hastalığın nadir olduğu yerlerde uygulanan aynı test, gerçek pozitiflere kıyasla daha fazla yanlış pozitif üretme eğilimindedir. Olabilirlik oranları, duyarlılık ve özgüllüğü, test öncesi olasılıkları test sonrası olasılıklara güncelleyen faktörler halinde birleştirir. Bir test sürekli veya sıralı bir ölçüm ürettiğinde, karar eşiğini değiştirmek duyarlılığı özgüllükle takas eder; bu takasın tüm eşikler boyunca çizilmesi, herhangi bir tek kesme noktasından bağımsız olarak ayrımı özetleyen ROC eğrisini verir.
Klinik önem
Bu ölçütler, bir tarama veya tanı testinin amaca uygun olup olmadığını değerlendirmek ve rakip testleri eşit şartlarda karşılaştırmak için ortak bir dil oluşturmaktadır. Bunları anlamak, tanısal literatürün eleştirel değerlendirmesi için merkezi bir öneme sahiptir; bu alan, tanısal kanıtların nasıl üretildiğini ve yorumlandığını açıklamakta olup, bireysel tanı veya tedavi kararları için bir temel oluşturmamaktadır.
Epidemiyoloji
Doğruluk ölçütleri, popülasyon tarama programları hakkındaki kararların temelini oluşturmaktadır; bu programlarda, büyük ölçekteki yanlış pozitif ve yanlış negatif sonuçların etkileri, hastalık prevalansı ile birlikte, taramanın faydasının zarardan fazla olup olmadığını belirlemektedir. STARD gibi raporlama standartları, tanısal doğruluk çalışmalarının eksiksizliğini ve şeffaflığını artırmak amacıyla geliştirilmiştir ve spektrum ile doğrulama yanlılıkları, bildirilen doğruluğun geçerliliği için bilinen tehditler olarak kabul edilmektedir.
Kanıt ve kılavuzlar
STARD bildirimi, tanısal doğruluk çalışmalarının şeffaf bir şekilde raporlanması için bir kontrol listesi sunmakta ve biyomedikal dergiler tarafından geniş çapta desteklenmektedir.
Tarihçe
Tanı testlerinin resmi değerlendirmesi, yirminci yüzyıl ortalarındaki sinyal tespiti ve klinik karar verme üzerine yapılan çalışmalardan doğmuş ve 1970'lerde yanlı çalışma tasarımının görünür doğruluğu artırabileceği farkındalığıyla daha da geliştirilmiştir. Erişilebilir doğruluk ölçütleri, 1990'lar boyunca tıp literatüründe yaygınlaşmış; raporlama standartları ise 2000'lerde STARD bildirimiyle pekiştirilmiş ve 2015'te güncellenmiştir.
Tartışmalar
- Yüksek doğrulukta görünen bir test, taramada neden hala yanıltıcı olabilir?
- Prediktif değerler prevalansa bağlı olduğundan, yüksek duyarlılık ve özgüllüğe sahip bir test, düşük prevalanslı bir tarama popülasyonuna uygulandığında hala çok sayıda yanlış pozitif üretebilir; bu da tekrarlayan bir yanlış yorumlama kaynağıdır.
- Çalışma tasarımındaki yanlılıklar, bildirilen doğruluğu ne kadar bozar?
- Spektrum yanlılığı ve doğrulama yanlılığı, ölçülen duyarlılık ve özgüllüğü önemli ölçüde artırabilir; bu nedenle bildirilen doğruluk, vaka ve kontrol gruplarının nasıl seçildiği ve referans standardın nasıl uygulandığı ışığında yorumlanmalıdır.
Öne çıkan isimler
- Douglas Altman
- Jonathan Deeks
- David Grimes
- Kenneth Schulz
- Patrick Bossuyt
İlgili konular
Temel eserler
- ransohoff-feinstein-1978
- altman-bland-1994a
- altman-bland-1994b
- bossuyt-2015
Sıkça sorulan sorular
- Tarama testi ile tanı testi arasındaki fark nedir?
- Tarama testi, genellikle duyarlılığı ön planda tutarak, durumu olma olasılığı daha yüksek olan kişileri belirlemek amacıyla görünüşte sağlıklı kişilere uygulanır; tanı testi ise zaten şüphelenilen kişilerde hastalığı doğrulamak veya dışlamak için kullanılır. Her ikisi de bir referans standarda karşı aynı doğruluk ölçütleriyle değerlendirilmektedir.
- Prevalans, bir testin kullanışlılığı için neden önemlidir?
- Duyarlılık ve özgüllük testin kendisini tanımlarken, pozitif bir sonucun doğru olma olasılığı (pozitif prediktif değer), durum nadirleştikçe azalmaktadır; bu nedenle aynı test, yüksek prevalanslı bir klinikte bilgilendirici olabilirken, düşük prevalanslı bir tarama ortamında yanıltıcı olabilmektedir.