Klinik Bakımda Makine Öğrenimi ve Tahmine Dayalı Analitik
Makine öğrenimi ve tahmine dayalı analitik, bireysel hastalar için tanı, kötüleşme, yeniden yatış veya tedaviye yanıt gibi sonuçların olasılığını tahmin etmek amacıyla klinik ve sağlık verilerindeki örüntüleri kullanmaktadır. Bu konu, klinik tahmin modellerinin nasıl geliştirildiğini, doğrulandığını ve raporlandığını, ayrıca güvenilir modelleri yanıltıcı olanlardan ayıran metodolojik standartları ele almaktadır.
Tanım
Klinik makine öğrenimi, klinik olarak ilgili sonuçları tahmin etmek amacıyla hasta verilerinden istatistiksel ilişkileri öğrenen algoritmaların kullanılmasıdır; bir klinik tahmin modeli, bir birey için bir tanının (diagnostik) veya gelecekteki bir olayın (prognostik) olasılığını tahmin etmek üzere birden fazla öngörücüyü bir araya getirmektedir.
Kapsam
Bu giriş, tanı ve prognoz için denetimli öğrenmeyi, klinik ortamlarda kullanılan veri kaynaklarını ve özelliklerini, diskriminasyon (ayırt etme), kalibrasyon ve harici doğrulama gibi merkezi doğrulama kavramlarını, yanlılık ve aşırı uyum risklerini, ayrıca TRIPOD ve PROBAST gibi raporlama ve değerlendirme standartlarını kapsamaktadır. Klinik makine öğrenimini metodolojik bir konu olarak çerçevelemekte, klinik öneriler sunmaktan ziyade tahmin araçlarının nasıl inşa edildiğini ve değerlendirildiğini açıklamaktadır.
Anahtar kavramlar
- Denetimli öğrenme (tanı ve prognoz)
- Diskriminasyon (ayırt etme), kalibrasyon ve klinik fayda
- İç ve dış doğrulama
- Aşırı uyum ve iyimserlik
- Veri kümesi kayması ve genellenebilirlik
- Algoritmik yanlılık ve adillik
- Raporlama standartları (TRIPOD) ve yanlılık riski değerlendirmesi (PROBAST)
- Derin öğrenme ve özellik öğrenimi
Mekanizmalar
Bir klinik tahmin modeli, öngörücülerin bir sonuçla nasıl ilişkili olduğunu öğrenerek etiketli veriler üzerinde eğitilmektedir ve daha sonra diskriminasyon (sonucu yaşayanları yaşamayanlardan ne kadar iyi ayırdığı) ve kalibrasyon (tahmin edilen olasılıkların gözlemlenen frekanslarla ne kadar iyi eşleştiği) açısından değerlendirilmektedir. Modeller genellikle eğitildikleri veriler üzerinde iyimser performans sergileme eğiliminde olduğundan, yeni popülasyonlar üzerinde iç ve özellikle harici doğrulama esastır ve hedef ortamın geliştirme ortamından farklı olduğu durumlarda veri kümesi kayması (dataset shift) nedeniyle dağıtım (deployment) sekteye uğrayabilmektedir (Rajkomar, 2019). Derin öğrenme, görüntü, sinyal veya metin gibi ham girdilerden doğrudan özellikler öğrenerek bu fikirleri genişletmekte, bu da algısal görevlerde performansı artırırken yorumlanabilirliği karmaşıklaştırabilmektedir (Esteva, 2019).
Klinik önem
Tahmin modelleri, klinik sistemlere entegre edilmiş risk skorlarını, erken uyarı alarmlarını ve triyaj araçlarını giderek daha fazla beslemektedir, bu nedenle doğrulukları, kalibrasyonları ve adillikleri, klinisyenlerin aldığı rehberliğin kalitesini doğrudan etkilemektedir. Bu giriş, bu tür modellerin nasıl geliştirildiğini ve değerlendirildiğini açıklamaktadır; model çıktıları, klinik yorum ve denetim gerektiren olasılıksal tahminlerdir ve metin, herhangi bir bireysel tanı veya tedavi kararı için temel oluşturmamaktadır.
Kanıt ve kılavuzlar
Metodolojik konsensüs, şeffaf geliştirmeyi ve titiz doğrulamayı vurgulamaktadır. TRIPOD bildirimi, tahmin modeli çalışmalarının raporlama standartlarını belirleyerek yöntemlerin ve performansın değerlendirilebilmesini sağlamaktadır (Collins, 2015) ve PROBAST, bu tür çalışmalarda yanlılık riskini ve uygulanabilirliği değerlendirmek için yapılandırılmış bir araç sunmaktadır (Wolff, 2019). Tıpta makine öğrenimi üzerine yapılan derlemeler, harici doğrulamayı, kalibrasyonu, yanlılığa dikkat edilmesini ve retrospektif performans ile prospektif klinik fayda arasındaki boşluğu vurgulamaktadır (Rajkomar, 2019; Esteva, 2019).
Tarihçe
Klinik tahmin, regresyon tabanlı risk skorlarına dayanan uzun bir geçmişe sahiptir, ancak 2010'lu yıllar, elektronik sağlık kayıtları, görüntüleme ve daha büyük veri kümeleriyle beslenen makine öğrenimi ve derin öğrenmede hızlı bir büyüme görmüştür. Bununla birlikte, tekrarlanabilirlik, abartılı performans ve yanlılık konusunda artan endişeler ortaya çıkmış, bu da model çalışmalarını tutarlı metodolojik standartlara tabi tutmayı amaçlayan raporlama ve değerlendirme çerçevelerini (TRIPOD, PROBAST) teşvik etmiştir.
Tartışmalar
- Birçok model neden geliştirme çalışmalarından daha kötü performans göstermektedir?
- Yetersiz harici doğrulama, geliştirme ve dağıtım ortamları arasındaki veri kümesi kayması ve iyimser raporlama, güçlü retrospektif performansın genellikle prospektif klinik faydaya dönüşemediği anlamına gelmekte, bu da daha katı doğrulama ve raporlama standartlarını teşvik etmektedir.
- Algoritmik yanlılık ve adillik nasıl ele alınmalıdır?
- Tarihsel veriler üzerinde eğitilen modeller, eşitsizlikleri kodlayabilir ve güçlendirebilir; bu durum, adilliğin nasıl ölçüleceği, gruplar arası performans farklılıklarının ne zaman kabul edilebilir olduğu ve dağıtılan modellerin zaman içindeki yanlılık açısından nasıl izleneceği konusunda tartışmaları gündeme getirmektedir.
Öne çıkan isimler
- Alvin Rajkomar
- Gary S. Collins
- Karel G. M. Moons
- Isaac Kohane
İlgili konular
Temel eserler
- rajkomar-2019
- collins-2015
- wolff-2019
Sıkça sorulan sorular
- Diskriminasyon (ayırt etme) ve kalibrasyon arasındaki fark nedir?
- Diskriminasyon, bir modelin hastaları, sonucu yaşayanların yaşamayanlardan daha yüksek tahmin edilen risklere sahip olacak şekilde sıralama yeteneğidir; kalibrasyon ise tahmin edilen olasılıklar ile gözlemlenen frekanslar arasındaki uyumdur; bir model iyi ayırt edebilir ancak kötü kalibre edilmiş olabilir, bu nedenle her ikisi de önemlidir.
- Klinik tahmin modelleri için harici doğrulama neden önemlidir?
- Modeller genellikle kendilerini oluşturmak için kullanılan veriler üzerinde iyimser performans sergilemektedir; bağımsız popülasyonlar ve ortamlarda test yapmak, bir modelin ne kadar iyi genellenebildiğini ortaya koymakta ve vaka karışımı veya dokümantasyonun geliştirme verilerinden farklı olduğu durumlarda başarısız olan araçların dağıtılmasını engellemektedir.