अभिकलनात्मक पाठ विश्लेषण
जब साहित्यिक और ऐतिहासिक प्रश्न हजारों या लाखों ग्रंथों के पैमाने पर पूछे जाते हैं, तो अभिकलन पढ़ने की एक विधि बन जाता है। यह क्षेत्र उन मात्रात्मक तकनीकों को एकत्रित करता है जिनका उपयोग डिजिटल मानविकी बड़े शाब्दिक संग्रहों में पैटर्न खोजने के लिए करती है - और उन पैटर्नों के अर्थ पर जीवंत बहस भी शामिल है।
Definition
पैटर्न का पता लगाने, साहित्यिक या ऐतिहासिक परिवर्तन को मॉडल करने और गहन पठन से परे पैमाने पर व्याख्यात्मक प्रश्न पूछने के लिए मानविकी ग्रंथों के बड़े संग्रहों पर मात्रात्मक और अभिकलनात्मक तकनीकों का अनुप्रयोग।
Scope
मानविकी ग्रंथों पर लागू मात्रात्मक और अभिकलनात्मक विधियों को शामिल करता है: दूरस्थ पठन और मैक्रोएनालिसिस, स्टाइलोमेट्री और लेखकत्व निर्धारण, विषय मॉडलिंग और पाठ खनन, और इन विधियों के लिए आवश्यक संग्रहों का निर्माण। अभिकलनात्मक साहित्यिक अध्ययनों की वैधता और व्याख्यात्मक मूल्य के बारे में पद्धतिगत बहसें शामिल हैं। कॉर्पस भाषाविज्ञान और प्राकृतिक भाषा प्रसंस्करण से भिन्न है, जो भाषाविज्ञान और कंप्यूटर विज्ञान के अंतर्गत आते हैं।
Sub-topics
Core questions
- बड़े पैमाने पर मात्रात्मक विश्लेषण क्या प्रकट कर सकता है जो गहन पठन नहीं कर सकता?
- अभिकलन द्वारा ग्रंथों में पाए गए पैटर्न कितने विश्वसनीय और व्याख्या योग्य हैं?
- संग्रह निर्माण और पूर्व-प्रसंस्करण परिणामों को कैसे आकार देते हैं?
- अभिकलनात्मक साक्ष्य को साहित्यिक और ऐतिहासिक व्याख्या से कैसे संबंधित होना चाहिए?
Key concepts
- दूरस्थ पठन
- संग्रह (Corpus)
- विशेषता (Feature)
- सांख्यिकीय मॉडल
- पूर्व-प्रसंस्करण (Preprocessing)
- बड़े पैमाने पर व्याख्या
Key theories
- दूरस्थ पठन
- मोरेटी ने कुछ प्रतिष्ठित कृतियों के गहन पठन के बजाय बड़े पैमाने के पैटर्न और अमूर्तताओं के माध्यम से साहित्य का अध्ययन करने का प्रस्ताव रखा, जिससे साहित्यिक इतिहास को पैमाने की समस्या के रूप में पुनः परिभाषित किया गया।
- मैक्रोएनालिसिस
- जॉकर ने तर्क दिया कि डिजिटल विधियाँ पूरे संग्रहों के एक सांख्यिकीय साहित्यिक इतिहास को सक्षम बनाती हैं, जो एकल कार्यों के स्तर पर अदृश्य प्रभाव और शैलीगत संरचना को प्रकट करती हैं।
- साहित्यिक परिवर्तन का प्रतिरूपण
- अंडरवुड ने बड़े संग्रहों के भविष्य कहनेवाला मॉडलिंग का उपयोग यह तर्क देने के लिए किया कि शैली और प्रतिष्ठा जैसी श्रेणियां अक्सर धीरे-धीरे और लगातार बदलती रहती हैं।
History
इसकी जड़ें बीसवीं सदी के मध्य में कॉनकॉर्डेंस निर्माण और मानविकी कंप्यूटिंग में निहित हैं। मोरेटी का दूरस्थ पठन (2000 के दशक), जॉकर का मैक्रोएनालिसिस (2013), और अंडरवुड का डिस्टेंट होराइजन्स (2019) ने अभिकलनात्मक साहित्यिक अध्ययनों को समेकित किया, जबकि दा की 2019 की आलोचना ने सांख्यिकीय कठोरता और व्याख्यात्मक लाभ पर बहस को तेज किया।
Debates
- सांख्यिकीय कठोरता बनाम व्याख्यात्मक मूल्य
- दा ने तर्क दिया कि अधिकांश अभिकलनात्मक साहित्यिक कार्य सांख्यिकीय रूप से कमजोर या व्याख्यात्मक रूप से पतले हैं; रक्षकों का तर्क है कि जब इन विधियों का सावधानी से उपयोग किया जाता है तो वे वास्तव में नए प्रश्न खोलती हैं।
Key figures
- Franco Moretti
- Matthew L. Jockers
- Ted Underwood
- Nan Z. Da
Related topics
Seminal works
- moretti2013
- jockers2013
- underwood2019
- da2019
Frequently asked questions
- यह कॉर्पस भाषाविज्ञान या एनएलपी से कैसे भिन्न है?
- यह कॉर्पस भाषाविज्ञान और प्राकृतिक भाषा प्रसंस्करण के साथ तकनीकों को साझा करता है, लेकिन यह भाषा को स्वयं मॉडल करने या अनुप्रयोगों का निर्माण करने के बजाय मानवीय प्रश्नों - साहित्यिक इतिहास, लेखकत्व, सांस्कृतिक परिवर्तन - से प्रेरित है। व्याख्यात्मक लक्ष्य, और उनके बारे में बहसें, डिजिटल मानविकी की विशेषता हैं।