ScholarGate
सहायक

ट्रीबैंक और एनोटेटेड कॉर्पोरा

भाषाई संरचना — सिंटैक्टिक ट्री, निर्भरताएँ, अर्थ और संस्थाएँ — के साथ हाथ से एनोटेट किए गए कॉर्पोरा जो कम्प्यूटेशनल भाषाविज्ञान के लिए प्रशिक्षण डेटा और स्वर्ण मानक के रूप में कार्य करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

एक ट्रीबैंक एक कॉर्पस है जिसमें प्रत्येक वाक्य को उसकी सिंटैक्टिक संरचना के साथ एनोटेट किया जाता है; अधिक व्यापक रूप से, एक एनोटेटेड कॉर्पस मनुष्यों द्वारा जोड़े गए स्पष्ट भाषाई लेबल को वहन करता है।

Scope

एनोटेटेड कॉर्पोरा के डिज़ाइन और निर्माण को शामिल करता है, विशेष रूप से ट्रीबैंक जो घटक या निर्भरता सिंटैक्स को वहन करते हैं, और उनके पीछे के एनोटेशन पाइपलाइन, दिशानिर्देश और गुणवत्ता नियंत्रण। इसमें पेन ट्रीबैंक परंपरा और क्रॉस-लिंगुअल यूनिवर्सल डिपेंडेंसीज़ प्रयास, और इंटर-एनोटेटर समझौते की भूमिका शामिल है। सामान्य कॉर्पस डिज़ाइन और लेक्सिकल संसाधन संबंधित विषयों में शामिल हैं।

Core questions

  • ट्रीबैंक कैसे डिज़ाइन किए जाते हैं और वे किन एनोटेशन योजनाओं का उपयोग करते हैं?
  • पर्यवेक्षित शिक्षण के लिए एनोटेटेड कॉर्पोरा अपरिहार्य क्यों हैं?
  • एनोटेशन गुणवत्ता कैसे सुनिश्चित और मापी जाती है?
  • यूनिवर्सल डिपेंडेंसीज़ जैसे क्रॉस-लिंगुअल एनोटेशन संगति कैसे प्राप्त करते हैं?

Key concepts

  • ट्रीबैंक
  • एनोटेशन योजना
  • एनोटेशन दिशानिर्देश
  • स्वर्ण मानक
  • इंटर-एनोटेटर समझौता
  • पेन ट्रीबैंक
  • यूनिवर्सल डिपेंडेंसीज़
  • निर्णय

Key theories

ट्रीबैंक-संचालित पर्यवेक्षित शिक्षण
हाथ से एनोटेट किए गए सिंटैक्टिक कॉर्पोरा पर्यवेक्षण संकेत प्रदान करते हैं जिसने सांख्यिकीय पार्सिंग, टैगिंग और कई एनएलपी कार्यों को संभव बनाया।
क्रॉस-लिंगुअल सामंजस्यपूर्ण एनोटेशन
यूनिवर्सल डिपेंडेंसीज़ कई भाषाओं में एक ही एनोटेशन योजना लागू करती है, जिससे तुलनीय ट्रीबैंक और मॉडल का स्थानांतरण संभव होता है।

History

पेन ट्रीबैंक (1993) पहला बड़ा सिंटैक्टिक रूप से एनोटेटेड कॉर्पस था और इसने सांख्यिकीय पार्सिंग को उत्प्रेरित किया। बाद के ट्रीबैंकों ने सिमेंटिक और डिस्कोर्स परतों को जोड़ा, और यूनिवर्सल डिपेंडेंसीज़ परियोजना ने भाषाओं में एनोटेशन को मानकीकृत किया, जो वास्तविक बहुभाषी ट्रीबैंक संसाधन बन गया।

Debates

एनोटेशन की गहराई बनाम संगति
समृद्ध एनोटेशन अधिक भाषाई विवरण कैप्चर करता है लेकिन इसे लगातार लागू करना कठिन होता है; परियोजनाओं को सैद्धांतिक परिष्कार और विश्वसनीय, स्केलेबल एनोटेशन के बीच संतुलन बनाना चाहिए।

Key figures

  • Mitchell Marcus
  • Beatrice Santorini
  • Marie-Catherine de Marneffe
  • Joakim Nivre

Related topics

Seminal works

  • marcus1993
  • demarneffe2021

Frequently asked questions

यदि पार्सर मौजूद हैं तो ट्रीबैंक हाथ से क्यों बनाए जाते हैं?
पार्सर मानव-एनोटेटेड ट्रीबैंकों के विरुद्ध प्रशिक्षित और मूल्यांकन किए जाते हैं, जो स्वर्ण मानक के रूप में कार्य करते हैं। विश्वसनीय हस्त-एनोटेशन के बिना सीखने या सटीकता को मापने के लिए कुछ भी नहीं होगा।

Methods for this concept

Related concepts