Diskriminasyon (ayırt etme) ve kalibrasyon arasındaki fark nedir?

Diskriminasyon, bir modelin hastaları, sonucu yaşayanların yaşamayanlardan daha yüksek tahmin edilen risklere sahip olacak şekilde sıralama yeteneğidir; kalibrasyon ise tahmin edilen olasılıklar ile gözlemlenen frekanslar arasındaki uyumdur; bir model iyi ayırt edebilir ancak kötü kalibre edilmiş olabilir, bu nedenle her ikisi de önemlidir.

Klinik tahmin modelleri için harici doğrulama neden önemlidir?

Modeller genellikle kendilerini oluşturmak için kullanılan veriler üzerinde iyimser performans sergilemektedir; bağımsız popülasyonlar ve ortamlarda test yapmak, bir modelin ne kadar iyi genellenebildiğini ortaya koymakta ve vaka karışımı veya dokümantasyonun geliştirme verilerinden farklı olduğu durumlarda başarısız olan araçların dağıtılmasını engellemektedir.

Klinik Bakımda Makine Öğrenimi ve Tahmine Dayalı Analitik

Makine öğrenimi ve tahmine dayalı analitik, bireysel hastalar için tanı, kötüleşme, yeniden yatış veya tedaviye yanıt gibi sonuçların olasılığını tahmin etmek amacıyla klinik ve sağlık verilerindeki örüntüleri kullanmaktadır. Bu konu, klinik tahmin modellerinin nasıl geliştirildiğini, doğrulandığını ve raporlandığını, ayrıca güvenilir modelleri yanıltıcı olanlardan ayıran metodolojik standartları ele almaktadır.

PaperMind ile konu bulYakındaMakale ve konu bul

Tools & resources

Slaytları indir

Learn & explore

VideoYakında

Tanım

Klinik makine öğrenimi, klinik olarak ilgili sonuçları tahmin etmek amacıyla hasta verilerinden istatistiksel ilişkileri öğrenen algoritmaların kullanılmasıdır; bir klinik tahmin modeli, bir birey için bir tanının (diagnostik) veya gelecekteki bir olayın (prognostik) olasılığını tahmin etmek üzere birden fazla öngörücüyü bir araya getirmektedir.

Kapsam

Bu giriş, tanı ve prognoz için denetimli öğrenmeyi, klinik ortamlarda kullanılan veri kaynaklarını ve özelliklerini, diskriminasyon (ayırt etme), kalibrasyon ve harici doğrulama gibi merkezi doğrulama kavramlarını, yanlılık ve aşırı uyum risklerini, ayrıca TRIPOD ve PROBAST gibi raporlama ve değerlendirme standartlarını kapsamaktadır. Klinik makine öğrenimini metodolojik bir konu olarak çerçevelemekte, klinik öneriler sunmaktan ziyade tahmin araçlarının nasıl inşa edildiğini ve değerlendirildiğini açıklamaktadır.

Anahtar kavramlar

Denetimli öğrenme (tanı ve prognoz)
Diskriminasyon (ayırt etme), kalibrasyon ve klinik fayda
İç ve dış doğrulama
Aşırı uyum ve iyimserlik
Veri kümesi kayması ve genellenebilirlik
Algoritmik yanlılık ve adillik
Raporlama standartları (TRIPOD) ve yanlılık riski değerlendirmesi (PROBAST)
Derin öğrenme ve özellik öğrenimi

Mekanizmalar

Bir klinik tahmin modeli, öngörücülerin bir sonuçla nasıl ilişkili olduğunu öğrenerek etiketli veriler üzerinde eğitilmektedir ve daha sonra diskriminasyon (sonucu yaşayanları yaşamayanlardan ne kadar iyi ayırdığı) ve kalibrasyon (tahmin edilen olasılıkların gözlemlenen frekanslarla ne kadar iyi eşleştiği) açısından değerlendirilmektedir. Modeller genellikle eğitildikleri veriler üzerinde iyimser performans sergileme eğiliminde olduğundan, yeni popülasyonlar üzerinde iç ve özellikle harici doğrulama esastır ve hedef ortamın geliştirme ortamından farklı olduğu durumlarda veri kümesi kayması (dataset shift) nedeniyle dağıtım (deployment) sekteye uğrayabilmektedir (Rajkomar, 2019). Derin öğrenme, görüntü, sinyal veya metin gibi ham girdilerden doğrudan özellikler öğrenerek bu fikirleri genişletmekte, bu da algısal görevlerde performansı artırırken yorumlanabilirliği karmaşıklaştırabilmektedir (Esteva, 2019).

Klinik önem

Tahmin modelleri, klinik sistemlere entegre edilmiş risk skorlarını, erken uyarı alarmlarını ve triyaj araçlarını giderek daha fazla beslemektedir, bu nedenle doğrulukları, kalibrasyonları ve adillikleri, klinisyenlerin aldığı rehberliğin kalitesini doğrudan etkilemektedir. Bu giriş, bu tür modellerin nasıl geliştirildiğini ve değerlendirildiğini açıklamaktadır; model çıktıları, klinik yorum ve denetim gerektiren olasılıksal tahminlerdir ve metin, herhangi bir bireysel tanı veya tedavi kararı için temel oluşturmamaktadır.

Kanıt ve kılavuzlar

Metodolojik konsensüs, şeffaf geliştirmeyi ve titiz doğrulamayı vurgulamaktadır. TRIPOD bildirimi, tahmin modeli çalışmalarının raporlama standartlarını belirleyerek yöntemlerin ve performansın değerlendirilebilmesini sağlamaktadır (Collins, 2015) ve PROBAST, bu tür çalışmalarda yanlılık riskini ve uygulanabilirliği değerlendirmek için yapılandırılmış bir araç sunmaktadır (Wolff, 2019). Tıpta makine öğrenimi üzerine yapılan derlemeler, harici doğrulamayı, kalibrasyonu, yanlılığa dikkat edilmesini ve retrospektif performans ile prospektif klinik fayda arasındaki boşluğu vurgulamaktadır (Rajkomar, 2019; Esteva, 2019).

Tarihçe

Klinik tahmin, regresyon tabanlı risk skorlarına dayanan uzun bir geçmişe sahiptir, ancak 2010'lu yıllar, elektronik sağlık kayıtları, görüntüleme ve daha büyük veri kümeleriyle beslenen makine öğrenimi ve derin öğrenmede hızlı bir büyüme görmüştür. Bununla birlikte, tekrarlanabilirlik, abartılı performans ve yanlılık konusunda artan endişeler ortaya çıkmış, bu da model çalışmalarını tutarlı metodolojik standartlara tabi tutmayı amaçlayan raporlama ve değerlendirme çerçevelerini (TRIPOD, PROBAST) teşvik etmiştir.

Tartışmalar

Birçok model neden geliştirme çalışmalarından daha kötü performans göstermektedir?: Yetersiz harici doğrulama, geliştirme ve dağıtım ortamları arasındaki veri kümesi kayması ve iyimser raporlama, güçlü retrospektif performansın genellikle prospektif klinik faydaya dönüşemediği anlamına gelmekte, bu da daha katı doğrulama ve raporlama standartlarını teşvik etmektedir.
Algoritmik yanlılık ve adillik nasıl ele alınmalıdır?: Tarihsel veriler üzerinde eğitilen modeller, eşitsizlikleri kodlayabilir ve güçlendirebilir; bu durum, adilliğin nasıl ölçüleceği, gruplar arası performans farklılıklarının ne zaman kabul edilebilir olduğu ve dağıtılan modellerin zaman içindeki yanlılık açısından nasıl izleneceği konusunda tartışmaları gündeme getirmektedir.

Öne çıkan isimler

Alvin Rajkomar
Gary S. Collins
Karel G. M. Moons
Isaac Kohane

İlgili konular

Temel eserler

rajkomar-2019
collins-2015
wolff-2019

Sıkça sorulan sorular

Diskriminasyon (ayırt etme) ve kalibrasyon arasındaki fark nedir?: Diskriminasyon, bir modelin hastaları, sonucu yaşayanların yaşamayanlardan daha yüksek tahmin edilen risklere sahip olacak şekilde sıralama yeteneğidir; kalibrasyon ise tahmin edilen olasılıklar ile gözlemlenen frekanslar arasındaki uyumdur; bir model iyi ayırt edebilir ancak kötü kalibre edilmiş olabilir, bu nedenle her ikisi de önemlidir.
Klinik tahmin modelleri için harici doğrulama neden önemlidir?: Modeller genellikle kendilerini oluşturmak için kullanılan veriler üzerinde iyimser performans sergilemektedir; bağımsız popülasyonlar ve ortamlarda test yapmak, bir modelin ne kadar iyi genellenebildiğini ortaya koymakta ve vaka karışımı veya dokümantasyonun geliştirme verilerinden farklı olduğu durumlarda başarısız olan araçların dağıtılmasını engellemektedir.