Computergestützte Textanalyse
Wenn literarische und historische Fragen im Umfang von Tausenden oder Millionen von Texten gestellt werden, wird die Computergestützte Analyse zu einer Lesemethode. Dieser Bereich umfasst die quantitativen Techniken, die die Digital Humanities verwenden, um Muster in großen Textkorpora zu finden – und die lebhafte Debatte darüber, was diese Muster bedeuten.
Definition
Die Anwendung quantitativer und computergestützter Techniken auf große Sammlungen geisteswissenschaftlicher Texte, um Muster zu erkennen, literarische oder historische Veränderungen zu modellieren und interpretative Fragen in einem Umfang zu stellen, der über das Close Reading hinausgeht.
Scope
Umfasst quantitative und computergestützte Methoden, die auf geisteswissenschaftliche Texte angewendet werden: Distant Reading und Makroanalyse, Stilometrie und Autorenzuweisung, Topic Modeling und Text Mining sowie die Erstellung der Korpora, die diese Methoden erfordern. Beinhaltet methodologische Debatten über die Validität und den interpretativen Wert computergestützter Literaturwissenschaften. Unterscheidet sich von der Korpuslinguistik und der Verarbeitung natürlicher Sprache, die in der Linguistik und Informatik angesiedelt sind.
Sub-topics
Core questions
- Was kann eine groß angelegte quantitative Analyse aufdecken, was ein Close Reading nicht kann?
- Wie zuverlässig und interpretierbar sind die Muster, die die Computergestützte Analyse in Texten findet?
- Wie beeinflussen Korpuskonstruktion und Vorverarbeitung die Ergebnisse?
- Wie sollte computergestützte Evidenz mit literarischer und historischer Interpretation in Beziehung stehen?
Key concepts
- Distant Reading
- Korpus
- Merkmal
- Statistisches Modell
- Vorverarbeitung
- Interpretation im großen Maßstab
Key theories
- Distant Reading
- Moretti schlug vor, Literatur durch großflächige Muster und Abstraktionen zu untersuchen, anstatt durch das Close Reading einiger kanonischer Werke, wodurch die Literaturgeschichte als ein Problem des Maßstabs neu definiert wurde.
- Makroanalyse
- Jockers argumentierte, dass digitale Methoden eine statistische Literaturgeschichte ganzer Korpora ermöglichen, die Einflüsse und stilistische Strukturen aufzeigt, die auf der Ebene einzelner Werke unsichtbar sind.
- Modellierung literarischer Veränderungen
- Underwood nutzte prädiktive Modellierungen großer Sammlungen, um zu argumentieren, dass Kategorien wie Genre und Prestige sich oft allmählich und kontinuierlich ändern.
History
Die Wurzeln liegen in der Konkordanz-Erstellung und den Geisteswissenschaftlichen Computeranwendungen Mitte des 20. Jahrhunderts. Morettis Distant Reading (2000er), Jockers' Macroanalysis (2013) und Underwoods Distant Horizons (2019) konsolidierten die computergestützten Literaturwissenschaften, während Das Kritik von 2019 die Debatte über statistische Genauigkeit und interpretativen Nutzen verschärfte.
Debates
- Statistische Genauigkeit versus interpretativer Wert
- Da argumentierte, dass viele computergestützte literarische Arbeiten statistisch schwach oder interpretativ dünn sind; Verteidiger behaupten, dass die Methoden bei sorgfältiger Anwendung tatsächlich neue Fragen aufwerfen.
Key figures
- Franco Moretti
- Matthew L. Jockers
- Ted Underwood
- Nan Z. Da
Related topics
Seminal works
- moretti2013
- jockers2013
- underwood2019
- da2019
Frequently asked questions
- Wie unterscheidet sich dies von Korpuslinguistik oder NLP?
- Es teilt Techniken mit der Korpuslinguistik und der Verarbeitung natürlicher Sprache, wird aber von humanistischen Fragen – Literaturgeschichte, Autorschaft, kultureller Wandel – angetrieben, anstatt von der Modellierung der Sprache selbst oder dem Aufbau von Anwendungen. Die interpretativen Ziele und die Debatten darüber sind charakteristisch für die Digital Humanities.