व्याकरण औपचारिकताएँ
प्राकृतिक-भाषा के सिंटैक्स का वर्णन करने के लिए उपयोग की जाने वाली समृद्ध व्याकरण प्रणालियाँ जो सामान्य संदर्भ-मुक्त नियमों से परे हैं — ट्री-एडजॉइनिंग, कैटेगोरियल और एकीकरण-आधारित व्याकरण — जो अभिव्यंजकता को पार्स करने की क्षमता के साथ संतुलित करती हैं।
Definition
एक व्याकरण औपचारिकता एक भाषा की कानूनी संरचनाओं को निर्दिष्ट करने के लिए एक प्रणाली है, जो इसकी जनरेटिव शक्ति, इसके प्रतिनिधित्वत्मक उपकरणों और इसे पार्स करने की जटिलता की विशेषता है।
Scope
इसमें उन औपचारिकताओं को शामिल किया गया है जिन्हें वाक्यात्मक घटनाओं को पकड़ने के लिए डिज़ाइन किया गया है जिन्हें संदर्भ-मुक्त व्याकरण अजीब तरह से संभालते हैं: ट्री-एडजॉइनिंग व्याकरण (TAG), कॉम्बिनेटरी कैटेगोरियल व्याकरण (CCG), और एकीकरण- या फीचर-आधारित व्याकरण जैसे HPSG और LFG। यह हल्की संदर्भ-संवेदनशीलता की धारणा और भाषाई पर्याप्तता तथा कम्प्यूटेशनल ट्रैक्टेबिलिटी के बीच के व्यापार-बंद को संबोधित करता है। घटक और निर्भरता के लिए विशिष्ट पार्सिंग एल्गोरिदम को अलग से कवर किया गया है।
Core questions
- संदर्भ-मुक्त व्याकरणों से आगे बढ़ने के लिए कौन सी वाक्यात्मक घटनाएँ प्रेरित करती हैं?
- हल्की संदर्भ-संवेदनशीलता क्या है और इसे भाषा के लिए सही शक्ति क्यों माना जाता है?
- एकीकरण और सुविधाएँ व्याकरणों को एक संरचना में जानकारी साझा करने की अनुमति कैसे देते हैं?
- ये औपचारिकताएँ कुशल पार्सिंग के विरुद्ध अभिव्यंजकता का व्यापार कैसे करती हैं?
Key concepts
- ट्री-एडजॉइनिंग व्याकरण
- कॉम्बिनेटरी कैटेगोरियल व्याकरण
- एकीकरण व्याकरण
- फीचर संरचना
- हल्की संदर्भ-संवेदनशीलता
- HPSG
- LFG
- उपवर्गीकरण
Key theories
- हल्की संदर्भ-संवेदनशीलता
- व्याकरणों का एक वर्ग, जिसमें TAG और CCG शामिल हैं, जो संदर्भ-मुक्त शक्ति से बस इतना अधिक है कि क्रॉस-सीरियल निर्भरता को पकड़ सके जबकि बहुपद-समय में पार्स करने योग्य बना रहे।
- कॉम्बिनेटरी कैटेगोरियल व्याकरण
- एक लेक्सिकलाइज़्ड औपचारिकता जिसमें शब्द कार्यात्मक श्रेणियां ले जाते हैं जो संयोजकों के एक छोटे से सेट द्वारा संयोजित होते हैं, सिंटैक्स को रचनात्मक सिमेंटिक्स के साथ कसकर जोड़ते हैं।
- एकीकरण-आधारित व्याकरण
- HPSG जैसी औपचारिकताएँ जो भाषाई वस्तुओं को टाइप की गई फीचर संरचनाओं के रूप में दर्शाती हैं जो एकीकरण द्वारा संयोजित होती हैं, सहमति और उपवर्गीकरण को घोषणात्मक रूप से पकड़ती हैं।
History
1980 और 1990 के दशक के दौरान, भाषाविदों ने संदर्भ-मुक्त व्याकरणों की तुलना में समृद्ध औपचारिकताओं का विकास किया ताकि सहमति, लंबी दूरी की निर्भरता और सिंटैक्स-सिमेंटिक्स इंटरफ़ेस को पकड़ा जा सके। जोशी के ट्री-एडजॉइनिंग व्याकरण ने हल्की संदर्भ-संवेदनशीलता को औपचारिक रूप दिया, जबकि CCG और HPSG ने लेक्सिकलाइज़्ड और एकीकरण-आधारित विकल्प प्रदान किए जो सैद्धांतिक और कम्प्यूटेशनल दोनों कार्यों में प्रभावशाली बने हुए हैं।
Debates
- अभिव्यंजकता बनाम ट्रैक्टेबिलिटी
- अधिक शक्तिशाली औपचारिकताएँ अधिक घटनाओं का वर्णन कर सकती हैं लेकिन अट्रैक्टेबल पार्सिंग का जोखिम उठाती हैं; क्षेत्र सामान्यतः डेटा को कवर करने के लिए पर्याप्त न्यूनतम शक्ति का पक्षधर है, इसलिए हल्की संदर्भ-संवेदनशील व्याकरणों में रुचि है।
Key figures
- Aravind Joshi
- Mark Steedman
- Carl Pollard
- Ivan Sag
Related topics
Seminal works
- joshi1997
- steedman2000
- pollard1994
Frequently asked questions
- सब कुछ के लिए केवल संदर्भ-मुक्त व्याकरणों का उपयोग क्यों नहीं किया जाता है?
- कुछ संरचनाएँ, जैसे डच और स्विस जर्मन में क्रॉस-सीरियल निर्भरताएँ, सिद्ध रूप से संदर्भ-मुक्त व्याकरणों द्वारा उत्पन्न नहीं की जा सकती हैं। हल्की संदर्भ-संवेदनशील औपचारिकताएँ उन्हें संभालने के लिए बस पर्याप्त शक्ति जोड़ती हैं जबकि कुशलता से पार्स करने योग्य रहती हैं।