शैलीमिति और लेखकत्व आरोपण
लेखक सांख्यिकीय निशान छोड़ जाते हैं। छोटे, अचेतन शब्दों — 'द', 'ऑफ', और 'एंड' — की आवृत्तियाँ किसी लेखक के काम के भीतर बहुत कम बदलती हैं, लेकिन लेखकों के बीच भिन्न होती हैं, और शैलीमिति इसका उपयोग विवादित लेखकत्व को सुलझाने और शैली का मात्रात्मक अध्ययन करने के लिए करती है।
Definition
लेखकों को चिह्नित करने और अनिश्चित या विवादित लेखकत्व के ग्रंथों को आरोपित करने के लिए लेखन शैली की मापने योग्य विशेषताओं का सांख्यिकीय विश्लेषण।
Scope
साहित्यिक शैली के मात्रात्मक माप और लेखकों को ग्रंथों के आरोपण में इसके उपयोग को शामिल करता है: शैलीगत विशेषताओं का चुनाव, बुरो के डेल्टा जैसे दूरी और वर्गीकरण माप, और आरोपण दावों का सत्यापन। इसमें फेडरलिस्ट पेपर्स से लेकर आधुनिक मशीन-लर्निंग विधियों तक के क्षेत्र का इतिहास, और इसके फोरेंसिक अनुप्रयोग शामिल हैं।
Core questions
- कौन सी पाठ्य विशेषताएँ किसी लेखक की विशिष्ट शैली को सबसे अच्छी तरह से पकड़ती हैं?
- आरोपण दावों का परीक्षण और सत्यापन कैसे किया जा सकता है?
- फंक्शन-वर्ड आवृत्तियाँ आरोपण के लिए इतनी प्रभावी क्यों हैं?
- शैलियों, अवधियों और अनुवादों में शैलीमिति की सीमाएँ क्या हैं?
Key concepts
- फंक्शन शब्द
- बुरो का डेल्टा
- फीचर चयन
- वर्गीकरण
- क्रॉस-वैलिडेशन
Key theories
- लेखकीय संकेत के रूप में फंक्शन-वर्ड आवृत्ति
- मोस्टेलर और वालेस ने दिखाया कि सामान्य फंक्शन शब्दों की आवृत्तियाँ लेखकों में अंतर कर सकती हैं, विवादित फेडरलिस्ट पेपर्स को आरोपित करने के लिए बायेसियन अनुमान का उपयोग करते हुए।
- बुरो का डेल्टा
- बुरो ने डेल्टा पेश किया, जो सबसे अधिक बार आने वाले शब्दों पर एक दूरी माप है जो उम्मीदवार लेखकों को रैंक करने के लिए एक मानक, मजबूत विधि बन गया है।
- वर्गीकरण के रूप में आधुनिक आरोपण
- स्टैमाटोस ने सर्वेक्षण किया कि लेखकत्व आरोपण को पाठ-वर्गीकरण समस्या के रूप में कैसे तैयार किया जाता है, जिसमें फीचर सेट और मशीन-लर्निंग विधियों की तुलना की जाती है।
History
मात्रात्मक लेखकत्व अध्ययन उन्नीसवीं सदी का है, लेकिन मोस्टेलर और वालेस का 1964 का फेडरलिस्ट पेपर्स का अध्ययन आधुनिक सांख्यिकीय दृष्टिकोण स्थापित किया। बुरो के डेल्टा (2002) ने इस क्षेत्र को एक व्यापक रूप से अपनाया गया माप दिया, और स्टैमाटोस (2009) जैसे सर्वेक्षणों ने मशीन-लर्निंग वर्गीकरण और फोरेंसिक उपयोग में बदलाव को दर्शाया।
Debates
- आरोपणों की विश्वसनीयता और आत्मविश्वास
- शैलीमितीय विधियाँ शक्तिशाली हो सकती हैं फिर भी कॉर्पस आकार, शैली और पूर्व-प्रसंस्करण के प्रति संवेदनशील होती हैं, जिससे यह सवाल उठता है कि आरोपणों पर कितना विश्वास किया जाना चाहिए, खासकर फोरेंसिक संदर्भों में।
Key figures
- Frederick Mosteller
- David Wallace
- John Burrows
- Efstathios Stamatatos
Related topics
Seminal works
- mosteller1964
- burrows2002
- stamatatos2009
Frequently asked questions
- विशिष्ट शब्दावली के बजाय 'द' जैसे छोटे शब्दों पर ध्यान क्यों केंद्रित किया जाता है?
- विशिष्ट शब्दावली अक्सर लेखक के बजाय पाठ के विषय को दर्शाती है। सामान्य फंक्शन शब्दों का उपयोग अचेतन रूप से और लेखक के लेखन के भीतर स्थिर दरों पर किया जाता है, लेकिन लेखकों के बीच भिन्न होते हैं, जिससे वे शैली का एक विश्वसनीय, विषय-स्वतंत्र संकेत बन जाते हैं।