Ağaçbankaları ve Açıklamalı Derlemler
Dilbilimsel yapılarla (sözdizimsel ağaçlar, bağımlılıklar, anlamlar ve varlıklar) elle açıklanmış derlemler, hesaplamalı dilbilim için eğitim verisi ve altın standart olarak hizmet etmektedir.
Tanım
Bir ağaçbankası, her cümlenin sözdizimsel yapısıyla açıklanmış bir derlemdir; daha geniş anlamda, açıklanmış bir derlem, insanlar tarafından eklenmiş açık dilbilimsel etiketler taşımaktadır.
Kapsam
Bu kapsam, açıklanmış derlemlerin, özellikle bileşen veya bağımlılık sözdizimi taşıyan ağaçbankalarının tasarımı ve inşasını, ayrıca bunların arkasındaki açıklama süreçlerini, yönergelerini ve kalite kontrolünü ele almaktadır. Penn Treebank geleneğini, diller arası Universal Dependencies çabasını ve açıklayıcılar arası uyumun rolünü içermektedir. Genel derlem tasarımı ve sözcüksel kaynaklar ilgili diğer konularda incelenmektedir.
Temel sorular
- Ağaçbankaları nasıl tasarlanır ve hangi açıklama şemalarını kullanırlar?
- Açıklamalı derlemler denetimli öğrenme için neden vazgeçilmezdir?
- Açıklama kalitesi nasıl sağlanır ve ölçülür?
- Universal Dependencies gibi diller arası açıklama tutarlılığı nasıl sağlamaktadır?
Anahtar kavramlar
- ağaçbankası
- açıklama şeması
- açıklama yönergeleri
- altın standart
- açıklayıcılar arası uyum
- Penn Treebank
- Universal Dependencies
- uzlaştırma
Temel kuramlar
- Ağaçbankası odaklı denetimli öğrenme
- Elle açıklanmış sözdizimsel derlemler, istatistiksel ayrıştırmayı, etiketlemeyi ve birçok doğal dil işleme (NLP) görevini mümkün kılan denetim sinyalini sağlamaktadır.
- Diller arası uyumlu açıklama
- Universal Dependencies, birçok dilde tek bir açıklama şeması uygulayarak karşılaştırılabilir ağaçbankaları ve modellerin aktarımını mümkün kılmaktadır.
Tarihçe
Penn Treebank (1993), ilk büyük sözdizimsel olarak açıklanmış derlem olup istatistiksel ayrıştırmayı hızlandırmıştır. Sonraki ağaçbankaları anlamsal ve söylem katmanları eklemiş, Universal Dependencies projesi ise diller arası açıklamayı standartlaştırarak fiili çok dilli bir ağaçbankası kaynağı haline gelmiştir.
Tartışmalar
- Açıklama derinliği ve tutarlılık
- Daha zengin açıklama daha fazla dilbilimsel ayrıntıyı yakalamakla birlikte, tutarlı bir şekilde uygulanması daha zordur; projeler teorik inceliği güvenilir, ölçeklenebilir açıklamayla dengelemek zorundadır.
Öne çıkan isimler
- Mitchell Marcus
- Beatrice Santorini
- Marie-Catherine de Marneffe
- Joakim Nivre
İlgili konular
Temel eserler
- marcus1993
- demarneffe2021
Sıkça sorulan sorular
- Ayrıştırıcılar mevcutken ağaçbankaları neden elle oluşturulur?
- Ayrıştırıcılar, altın standart olarak hizmet eden insan eliyle açıklanmış ağaçbankaları üzerinde eğitilir ve değerlendirilir. Güvenilir elle açıklama olmasaydı, öğrenilecek veya doğruluğun ölçüleceği hiçbir şey olmazdı.