ScholarGate
सहायक

अभिकलनात्मक पाठ विश्लेषण

जब साहित्यिक और ऐतिहासिक प्रश्न हजारों या लाखों ग्रंथों के पैमाने पर पूछे जाते हैं, तो अभिकलन पढ़ने की एक विधि बन जाता है। यह क्षेत्र उन मात्रात्मक तकनीकों को एकत्रित करता है जिनका उपयोग डिजिटल मानविकी बड़े शाब्दिक संग्रहों में पैटर्न खोजने के लिए करती है - और उन पैटर्नों के अर्थ पर जीवंत बहस भी शामिल है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

पैटर्न का पता लगाने, साहित्यिक या ऐतिहासिक परिवर्तन को मॉडल करने और गहन पठन से परे पैमाने पर व्याख्यात्मक प्रश्न पूछने के लिए मानविकी ग्रंथों के बड़े संग्रहों पर मात्रात्मक और अभिकलनात्मक तकनीकों का अनुप्रयोग।

Scope

मानविकी ग्रंथों पर लागू मात्रात्मक और अभिकलनात्मक विधियों को शामिल करता है: दूरस्थ पठन और मैक्रोएनालिसिस, स्टाइलोमेट्री और लेखकत्व निर्धारण, विषय मॉडलिंग और पाठ खनन, और इन विधियों के लिए आवश्यक संग्रहों का निर्माण। अभिकलनात्मक साहित्यिक अध्ययनों की वैधता और व्याख्यात्मक मूल्य के बारे में पद्धतिगत बहसें शामिल हैं। कॉर्पस भाषाविज्ञान और प्राकृतिक भाषा प्रसंस्करण से भिन्न है, जो भाषाविज्ञान और कंप्यूटर विज्ञान के अंतर्गत आते हैं।

Sub-topics

Core questions

  • बड़े पैमाने पर मात्रात्मक विश्लेषण क्या प्रकट कर सकता है जो गहन पठन नहीं कर सकता?
  • अभिकलन द्वारा ग्रंथों में पाए गए पैटर्न कितने विश्वसनीय और व्याख्या योग्य हैं?
  • संग्रह निर्माण और पूर्व-प्रसंस्करण परिणामों को कैसे आकार देते हैं?
  • अभिकलनात्मक साक्ष्य को साहित्यिक और ऐतिहासिक व्याख्या से कैसे संबंधित होना चाहिए?

Key concepts

  • दूरस्थ पठन
  • संग्रह (Corpus)
  • विशेषता (Feature)
  • सांख्यिकीय मॉडल
  • पूर्व-प्रसंस्करण (Preprocessing)
  • बड़े पैमाने पर व्याख्या

Key theories

दूरस्थ पठन
मोरेटी ने कुछ प्रतिष्ठित कृतियों के गहन पठन के बजाय बड़े पैमाने के पैटर्न और अमूर्तताओं के माध्यम से साहित्य का अध्ययन करने का प्रस्ताव रखा, जिससे साहित्यिक इतिहास को पैमाने की समस्या के रूप में पुनः परिभाषित किया गया।
मैक्रोएनालिसिस
जॉकर ने तर्क दिया कि डिजिटल विधियाँ पूरे संग्रहों के एक सांख्यिकीय साहित्यिक इतिहास को सक्षम बनाती हैं, जो एकल कार्यों के स्तर पर अदृश्य प्रभाव और शैलीगत संरचना को प्रकट करती हैं।
साहित्यिक परिवर्तन का प्रतिरूपण
अंडरवुड ने बड़े संग्रहों के भविष्य कहनेवाला मॉडलिंग का उपयोग यह तर्क देने के लिए किया कि शैली और प्रतिष्ठा जैसी श्रेणियां अक्सर धीरे-धीरे और लगातार बदलती रहती हैं।

History

इसकी जड़ें बीसवीं सदी के मध्य में कॉनकॉर्डेंस निर्माण और मानविकी कंप्यूटिंग में निहित हैं। मोरेटी का दूरस्थ पठन (2000 के दशक), जॉकर का मैक्रोएनालिसिस (2013), और अंडरवुड का डिस्टेंट होराइजन्स (2019) ने अभिकलनात्मक साहित्यिक अध्ययनों को समेकित किया, जबकि दा की 2019 की आलोचना ने सांख्यिकीय कठोरता और व्याख्यात्मक लाभ पर बहस को तेज किया।

Debates

सांख्यिकीय कठोरता बनाम व्याख्यात्मक मूल्य
दा ने तर्क दिया कि अधिकांश अभिकलनात्मक साहित्यिक कार्य सांख्यिकीय रूप से कमजोर या व्याख्यात्मक रूप से पतले हैं; रक्षकों का तर्क है कि जब इन विधियों का सावधानी से उपयोग किया जाता है तो वे वास्तव में नए प्रश्न खोलती हैं।

Key figures

  • Franco Moretti
  • Matthew L. Jockers
  • Ted Underwood
  • Nan Z. Da

Related topics

Seminal works

  • moretti2013
  • jockers2013
  • underwood2019
  • da2019

Frequently asked questions

यह कॉर्पस भाषाविज्ञान या एनएलपी से कैसे भिन्न है?
यह कॉर्पस भाषाविज्ञान और प्राकृतिक भाषा प्रसंस्करण के साथ तकनीकों को साझा करता है, लेकिन यह भाषा को स्वयं मॉडल करने या अनुप्रयोगों का निर्माण करने के बजाय मानवीय प्रश्नों - साहित्यिक इतिहास, लेखकत्व, सांस्कृतिक परिवर्तन - से प्रेरित है। व्याख्यात्मक लक्ष्य, और उनके बारे में बहसें, डिजिटल मानविकी की विशेषता हैं।

Methods for this concept

Related concepts