Klinik Dokümantasyonda Doğal Dil İşleme
Klinik bilgilerin büyük bir kısmı, yapılandırılmış kodlar yerine serbest metin, anlatısal notlar, taburculuk özetleri, radyoloji ve patoloji raporları şeklinde kaydedilmektedir. Klinik dokümantasyonda doğal dil işleme (NLP), bu metinlerden yapılandırılmış, makine tarafından kullanılabilir bilgileri çıkaran ve kodlama, kohort tanımlama gibi görevlerden karar destek ve tahmin sistemlerini beslemeye kadar çeşitli işlevleri destekleyen hesaplamalı yöntemler bütünüdür.
Tanım
Klinik doğal dil işleme, klinik serbest metindeki bilgileri tanımlamak, normalleştirmek ve yapılandırmak amacıyla hesaplamalı dilbilimsel yöntemlerin uygulanmasıdır; örneğin, durumlar, bulgular ve ilaçlara yapılan atıfları, olumsuzluk ve belirsizlik gibi bağlamları dikkate alarak kodlanmış kavramlara eşlemeyi içerir.
Kapsam
Bu madde, klinik anlatılara uygulanan temel NLP görevlerini (örneğin, belirteçlere ayırma (tokenisation), adlandırılmış varlık tanıma (named-entity recognition), kontrollü terminolojilere kavram normalizasyonu, olumsuzluk ve iddia tespiti ile ilişki çıkarma); yerleşik klinik NLP boru hatlarını (pipelines); klinik dilin kendine özgü zorluklarını; ve kural tabanlı yaklaşımlardan istatistiksel ve sinirsel yaklaşımlara geçişi kapsamaktadır. Metnin nasıl işlendiğini açıklayan metodolojik bir konudur, klinik tavsiyeler kaynağı değildir.
Anahtar kavramlar
- Adlandırılmış varlık tanıma ve kavram normalizasyonu
- Olumsuzluk ve iddia tespiti
- Bilgi çıkarma ve ilişki çıkarma
- UMLS / kontrollü terminolojilere kavram eşleme
- Klinik NLP boru hatları (örneğin, cTAKES)
- Kural tabanlı, istatistiksel ve sinirsel yöntemler
- Klinik metnin kimliksizleştirilmesi
- Belirsizlik, kısaltma ve alan kayması
Mekanizmalar
Klinik NLP genellikle aşamaları zincirler: metni segmentlere ayırma ve belirteçlere ayırma (tokenising), klinik olarak ilgili atıfları tanıma, bunları kontrollü bir kelime dağarcığındaki kavramlara normalleştirme ve olumsuzluk, belirsizlik veya bir bulgunun hastaya mı yoksa bir aile üyesine mi atıfta bulunduğunu gibi bağlamları tespit etme. cTAKES gibi açık boru hatları (pipelines), bu bileşenleri klinik anlatılar için paketlemiş ve çıkarılan terimleri standartlaştırılmış kavramlara eşlemiştir (Savova, 2010). Kavram normalizasyonu, birçok kaynak kelime dağarcığını birbirine bağlayan UMLS gibi kaynakların entegrasyonuna dayanır, böylece çeşitli yüzey formları ortak tanımlayıcılara çözümlenir (Bodenreider, 2004). Alan, el yapımı kurallardan istatistiksel ve sinirsel modellere doğru ilerlemiş, ancak temel görevler tutarlı kalmıştır (Nadkarni, 2011).
Klinik önem
Klinik olarak anlamlı birçok ayrıntı anlatısal notlarda yer aldığından, NLP bu ayrıntıların ne kadarının kodlama, kalite ölçümü, kohort seçimi ve sonraki karar desteği için kullanılabilir hale geleceğini belirler. Bu madde, klinik metnin nasıl işlendiğini ve yapılandırıldığını açıklamaktadır; çıkarılan bilgiler doğrulama ve insan gözetimi gerektirir ve metin, herhangi bir bireysel tanı veya tedavi kararı için temel oluşturmaz.
Kanıt ve kılavuzlar
Klinik NLP, klinik sonuç denemelerinden ziyade, genellikle göreve özgü performans metrikleri ve paylaşılan değerlendirme zorlukları aracılığıyla değerlendirilmektedir. Giriş ve sistem makaleleri, standart boru hattını (pipeline) ve bileşenlerini belgelemektedir (Nadkarni, 2011; Savova, 2010) ve kavram normalizasyonu, UMLS gibi terminolojilerin entegrasyonuna bağlıdır (Bodenreider, 2004). Performansın kurumlar ve not türleri arasında değişiklik gösterdiği bilinmekte olup, bu nedenle yerel doğrulama vurgulanmaktadır.
Tarihçe
Klinik NLP, erken tıbbi dil işleme sistemlerinden ve kural tabanlı örüntü eşleştirmeden gelişmiş, 2000'li yıllarda yeniden kullanılabilir açık kaynaklı boru hatları (pipelines) ve görevleri ve kıyaslamaları standartlaştıran paylaşılan değerlendirme zorlukları ile olgunlaşmıştır. 2010'lu yıllar boyunca alan, kural tabanlı ve klasik makine öğrenimi yöntemlerinden sinirsel ve daha sonra transformatör tabanlı dil modellerine doğru kaymış, ancak aynı temel çıkarma ve normalizasyon görevlerini korumuştur.
Tartışmalar
- Klinik NLP sistemleri farklı kurumlar arasında ne kadar taşınabilirdir?
- Bir kurumun notları üzerinde ayarlanmış modeller ve kurallar, şablon, kısaltma ve dokümantasyon stili farklılıkları nedeniyle genellikle başka bir kurumda performans düşüşü yaşar; bu durum genellenebilirlik, yerel adaptasyon ihtiyacı ve paylaşılan açıklama eklenmiş korpuslar (annotated corpora) üzerine tartışmaları beraberinde getirmektedir.
Öne çıkan isimler
- Wendy W. Chapman
- Guergana K. Savova
- Prakash M. Nadkarni
- Lucila Ohno-Machado
İlgili konular
Temel eserler
- nadkarni-2011
- savova-2010
- bodenreider-2004
Sıkça sorulan sorular
- Klinik metni işlemek neden genel metinden daha zordur?
- Klinik notlar kısaltmalar, yazım hataları, şablonlanmış parçalar ve alana özgü terimlerle yoğundur ve anlam genellikle olumsuzluk veya belirsizlik gibi bağlamlara bağlıdır; tüm bunlar doğru çıkarmayı sıradan düzyazıya göre daha zor hale getirmektedir.
- Klinik NLP'de kavram normalizasyonu nedir?
- Bu, 'kalp krizi' veya 'MI' gibi metinsel bir atfı, kontrollü bir kelime dağarcığındaki tek bir standartlaştırılmış kavrama eşleme adımıdır; böylece aynı fikrin farklı yüzey formları sonraki sistemler tarafından tutarlı bir şekilde işlenebilir.