पार्सिंग और व्याकरण औपचारिकताएँ
मशीन द्वारा वाक्यों की व्याकरणिक संरचना को पुनः प्राप्त करना: व्याकरणिक औपचारिकताएँ जो वैध संरचनाओं का वर्णन करती हैं और उन्हें संगणित करने वाले एल्गोरिदम, घटक वृक्षों से लेकर निर्भरता ग्राफ़ तक।
Definition
पार्सिंग एक व्याकरण के अनुसार इनपुट स्ट्रिंग को व्याकरणिक संरचना का अभिकलनात्मक असाइनमेंट है; व्याकरणिक औपचारिकताएँ वे प्रणालियाँ हैं जिनका उपयोग यह निर्दिष्ट करने के लिए किया जाता है कि कौन सी संरचनाएँ वैध हैं।
Scope
अभिकलनात्मक भाषाविज्ञान में वाक्यात्मक विश्लेषण को शामिल करता है — संदर्भ-मुक्त घटक पार्सिंग और इसके संभाव्य और चार्ट-आधारित एल्गोरिदम, निर्भरता पार्सिंग, सादे संदर्भ-मुक्त व्याकरणों से परे प्रमुख व्याकरणिक औपचारिकताएँ, और अनुक्रम-लेबलिंग कार्य (जैसे पद-भेद टैगिंग) जो पार्सिंग को पोषित करते हैं। इसमें अर्थ संबंधी व्याख्या शामिल नहीं है, जिसे अभिकलनात्मक अर्थ विज्ञान में संभाला जाता है, और अंतर्निहित ऑटोमेटा सिद्धांत, जिसे नींव में शामिल किया गया है।
Sub-topics
Core questions
- एक वाक्य को कुशलता से वाक्यात्मक वृक्ष या निर्भरता ग्राफ़ कैसे असाइन किया जा सकता है?
- कौन सी व्याकरणिक औपचारिकताएँ प्राकृतिक-भाषा वाक्यविन्यास को पर्याप्त रूप से कैप्चर करती हैं?
- संभाव्यताएँ कई संभावित पार्सों के बीच अस्पष्टता को दूर करने में कैसे मदद करती हैं?
- टैगिंग और चंकिंग पूर्ण पार्सिंग का समर्थन कैसे करते हैं?
Key concepts
- घटक पार्स
- निर्भरता पार्स
- संदर्भ-मुक्त व्याकरण
- चार्ट पार्सिंग
- संभाव्य व्याकरण
- पद-भेद टैगिंग
- ट्रीबैंक
- संरचनात्मक अस्पष्टता
Key theories
- चार्ट पार्सिंग
- CKY और Earley जैसे डायनामिक-प्रोग्रामिंग एल्गोरिदम जो साझा उप-पार्सों का पुन: उपयोग करके बहुपद समय में एक वाक्य के सभी संभावित विश्लेषणों की गणना करते हैं।
- संभाव्य संदर्भ-मुक्त व्याकरण
- व्याकरण नियमों में संभाव्यताएँ संलग्न करना ताकि सबसे संभावित पार्स का चयन किया जा सके, जो प्राकृतिक भाषा की व्यापक संरचनात्मक अस्पष्टता को संबोधित करता है।
History
प्रारंभिक पार्सिंग हस्तनिर्मित व्याकरणों और संपूर्ण खोज पर निर्भर करती थी; CKY और Earley एल्गोरिदम ने संदर्भ-मुक्त पार्सिंग को कुशल बनाया। 1990 के दशक में ट्रीबैंकों के जारी होने से डेटा-संचालित संभाव्य पार्सिंग सक्षम हुई, और 2000 के दशक में निर्भरता पार्सिंग ने अपनी अंतर-भाषाई सुदृढ़ता के लिए प्रमुखता प्राप्त की, जिसे बाद में न्यूरल पार्सर्स द्वारा समाहित कर लिया गया।
Debates
- घटक बनाम निर्भरता प्रतिनिधित्व
- क्या वाक्यविन्यास को नेस्टेड वाक्यांशों के रूप में या लेबल किए गए हेड-डिपेंडेंट संबंधों के रूप में सबसे अच्छी तरह से दर्शाया जाता है; दोनों का व्यापक रूप से उपयोग किया जाता है, जिसमें निर्भरता को मुक्त-शब्द-क्रम भाषाओं और डाउनस्ट्रीम कार्यों के लिए पसंद किया जाता है।
Key figures
- Jay Earley
- Joakim Nivre
- Christopher Manning
- Mitchell Marcus
Related topics
Seminal works
- manning1999
- kubler2009
- jurafsky2025
Frequently asked questions
- यदि व्याकरण के नियम ज्ञात हों तो पार्सिंग कठिन क्यों है?
- प्राकृतिक वाक्य अत्यधिक अस्पष्ट होते हैं: एक ही स्ट्रिंग में कई वैध संरचनाएँ हो सकती हैं। इसलिए पार्सिंग को न केवल संरचनाएँ ढूंढनी चाहिए बल्कि उन्हें रैंक भी करना चाहिए, यही कारण है कि संभाव्य और सीखे हुए मॉडल आवश्यक हैं।