ScholarGate
Asistan

Ağaçbankaları ve Açıklamalı Derlemler

Dilbilimsel yapılarla (sözdizimsel ağaçlar, bağımlılıklar, anlamlar ve varlıklar) elle açıklanmış derlemler, hesaplamalı dilbilim için eğitim verisi ve altın standart olarak hizmet etmektedir.

PaperMind ile konu bulYakındaMakale ve konu bul
Tools & resources
Slaytları indir
Learn & explore
VideoYakında

Tanım

Bir ağaçbankası, her cümlenin sözdizimsel yapısıyla açıklanmış bir derlemdir; daha geniş anlamda, açıklanmış bir derlem, insanlar tarafından eklenmiş açık dilbilimsel etiketler taşımaktadır.

Kapsam

Bu kapsam, açıklanmış derlemlerin, özellikle bileşen veya bağımlılık sözdizimi taşıyan ağaçbankalarının tasarımı ve inşasını, ayrıca bunların arkasındaki açıklama süreçlerini, yönergelerini ve kalite kontrolünü ele almaktadır. Penn Treebank geleneğini, diller arası Universal Dependencies çabasını ve açıklayıcılar arası uyumun rolünü içermektedir. Genel derlem tasarımı ve sözcüksel kaynaklar ilgili diğer konularda incelenmektedir.

Temel sorular

  • Ağaçbankaları nasıl tasarlanır ve hangi açıklama şemalarını kullanırlar?
  • Açıklamalı derlemler denetimli öğrenme için neden vazgeçilmezdir?
  • Açıklama kalitesi nasıl sağlanır ve ölçülür?
  • Universal Dependencies gibi diller arası açıklama tutarlılığı nasıl sağlamaktadır?

Anahtar kavramlar

  • ağaçbankası
  • açıklama şeması
  • açıklama yönergeleri
  • altın standart
  • açıklayıcılar arası uyum
  • Penn Treebank
  • Universal Dependencies
  • uzlaştırma

Temel kuramlar

Ağaçbankası odaklı denetimli öğrenme
Elle açıklanmış sözdizimsel derlemler, istatistiksel ayrıştırmayı, etiketlemeyi ve birçok doğal dil işleme (NLP) görevini mümkün kılan denetim sinyalini sağlamaktadır.
Diller arası uyumlu açıklama
Universal Dependencies, birçok dilde tek bir açıklama şeması uygulayarak karşılaştırılabilir ağaçbankaları ve modellerin aktarımını mümkün kılmaktadır.

Tarihçe

Penn Treebank (1993), ilk büyük sözdizimsel olarak açıklanmış derlem olup istatistiksel ayrıştırmayı hızlandırmıştır. Sonraki ağaçbankaları anlamsal ve söylem katmanları eklemiş, Universal Dependencies projesi ise diller arası açıklamayı standartlaştırarak fiili çok dilli bir ağaçbankası kaynağı haline gelmiştir.

Tartışmalar

Açıklama derinliği ve tutarlılık
Daha zengin açıklama daha fazla dilbilimsel ayrıntıyı yakalamakla birlikte, tutarlı bir şekilde uygulanması daha zordur; projeler teorik inceliği güvenilir, ölçeklenebilir açıklamayla dengelemek zorundadır.

Öne çıkan isimler

  • Mitchell Marcus
  • Beatrice Santorini
  • Marie-Catherine de Marneffe
  • Joakim Nivre

İlgili konular

Temel eserler

  • marcus1993
  • demarneffe2021

Sıkça sorulan sorular

Ayrıştırıcılar mevcutken ağaçbankaları neden elle oluşturulur?
Ayrıştırıcılar, altın standart olarak hizmet eden insan eliyle açıklanmış ağaçbankaları üzerinde eğitilir ve değerlendirilir. Güvenilir elle açıklama olmasaydı, öğrenilecek veya doğruluğun ölçüleceği hiçbir şey olmazdı.

Bu kavram için yöntemler

İlgili kavramlar