ScholarGate
सहायक

पार्सिंग और व्याकरण औपचारिकताएँ

मशीन द्वारा वाक्यों की व्याकरणिक संरचना को पुनः प्राप्त करना: व्याकरणिक औपचारिकताएँ जो वैध संरचनाओं का वर्णन करती हैं और उन्हें संगणित करने वाले एल्गोरिदम, घटक वृक्षों से लेकर निर्भरता ग्राफ़ तक।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

पार्सिंग एक व्याकरण के अनुसार इनपुट स्ट्रिंग को व्याकरणिक संरचना का अभिकलनात्मक असाइनमेंट है; व्याकरणिक औपचारिकताएँ वे प्रणालियाँ हैं जिनका उपयोग यह निर्दिष्ट करने के लिए किया जाता है कि कौन सी संरचनाएँ वैध हैं।

Scope

अभिकलनात्मक भाषाविज्ञान में वाक्यात्मक विश्लेषण को शामिल करता है — संदर्भ-मुक्त घटक पार्सिंग और इसके संभाव्य और चार्ट-आधारित एल्गोरिदम, निर्भरता पार्सिंग, सादे संदर्भ-मुक्त व्याकरणों से परे प्रमुख व्याकरणिक औपचारिकताएँ, और अनुक्रम-लेबलिंग कार्य (जैसे पद-भेद टैगिंग) जो पार्सिंग को पोषित करते हैं। इसमें अर्थ संबंधी व्याख्या शामिल नहीं है, जिसे अभिकलनात्मक अर्थ विज्ञान में संभाला जाता है, और अंतर्निहित ऑटोमेटा सिद्धांत, जिसे नींव में शामिल किया गया है।

Sub-topics

Core questions

  • एक वाक्य को कुशलता से वाक्यात्मक वृक्ष या निर्भरता ग्राफ़ कैसे असाइन किया जा सकता है?
  • कौन सी व्याकरणिक औपचारिकताएँ प्राकृतिक-भाषा वाक्यविन्यास को पर्याप्त रूप से कैप्चर करती हैं?
  • संभाव्यताएँ कई संभावित पार्सों के बीच अस्पष्टता को दूर करने में कैसे मदद करती हैं?
  • टैगिंग और चंकिंग पूर्ण पार्सिंग का समर्थन कैसे करते हैं?

Key concepts

  • घटक पार्स
  • निर्भरता पार्स
  • संदर्भ-मुक्त व्याकरण
  • चार्ट पार्सिंग
  • संभाव्य व्याकरण
  • पद-भेद टैगिंग
  • ट्रीबैंक
  • संरचनात्मक अस्पष्टता

Key theories

चार्ट पार्सिंग
CKY और Earley जैसे डायनामिक-प्रोग्रामिंग एल्गोरिदम जो साझा उप-पार्सों का पुन: उपयोग करके बहुपद समय में एक वाक्य के सभी संभावित विश्लेषणों की गणना करते हैं।
संभाव्य संदर्भ-मुक्त व्याकरण
व्याकरण नियमों में संभाव्यताएँ संलग्न करना ताकि सबसे संभावित पार्स का चयन किया जा सके, जो प्राकृतिक भाषा की व्यापक संरचनात्मक अस्पष्टता को संबोधित करता है।

History

प्रारंभिक पार्सिंग हस्तनिर्मित व्याकरणों और संपूर्ण खोज पर निर्भर करती थी; CKY और Earley एल्गोरिदम ने संदर्भ-मुक्त पार्सिंग को कुशल बनाया। 1990 के दशक में ट्रीबैंकों के जारी होने से डेटा-संचालित संभाव्य पार्सिंग सक्षम हुई, और 2000 के दशक में निर्भरता पार्सिंग ने अपनी अंतर-भाषाई सुदृढ़ता के लिए प्रमुखता प्राप्त की, जिसे बाद में न्यूरल पार्सर्स द्वारा समाहित कर लिया गया।

Debates

घटक बनाम निर्भरता प्रतिनिधित्व
क्या वाक्यविन्यास को नेस्टेड वाक्यांशों के रूप में या लेबल किए गए हेड-डिपेंडेंट संबंधों के रूप में सबसे अच्छी तरह से दर्शाया जाता है; दोनों का व्यापक रूप से उपयोग किया जाता है, जिसमें निर्भरता को मुक्त-शब्द-क्रम भाषाओं और डाउनस्ट्रीम कार्यों के लिए पसंद किया जाता है।

Key figures

  • Jay Earley
  • Joakim Nivre
  • Christopher Manning
  • Mitchell Marcus

Related topics

Seminal works

  • manning1999
  • kubler2009
  • jurafsky2025

Frequently asked questions

यदि व्याकरण के नियम ज्ञात हों तो पार्सिंग कठिन क्यों है?
प्राकृतिक वाक्य अत्यधिक अस्पष्ट होते हैं: एक ही स्ट्रिंग में कई वैध संरचनाएँ हो सकती हैं। इसलिए पार्सिंग को न केवल संरचनाएँ ढूंढनी चाहिए बल्कि उन्हें रैंक भी करना चाहिए, यही कारण है कि संभाव्य और सीखे हुए मॉडल आवश्यक हैं।

Methods for this concept

Related concepts