ScholarGate
Assistent

Computergestützte Textanalyse

Wenn literarische und historische Fragen im Umfang von Tausenden oder Millionen von Texten gestellt werden, wird die Computergestützte Analyse zu einer Lesemethode. Dieser Bereich umfasst die quantitativen Techniken, die die Digital Humanities verwenden, um Muster in großen Textkorpora zu finden – und die lebhafte Debatte darüber, was diese Muster bedeuten.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Die Anwendung quantitativer und computergestützter Techniken auf große Sammlungen geisteswissenschaftlicher Texte, um Muster zu erkennen, literarische oder historische Veränderungen zu modellieren und interpretative Fragen in einem Umfang zu stellen, der über das Close Reading hinausgeht.

Scope

Umfasst quantitative und computergestützte Methoden, die auf geisteswissenschaftliche Texte angewendet werden: Distant Reading und Makroanalyse, Stilometrie und Autorenzuweisung, Topic Modeling und Text Mining sowie die Erstellung der Korpora, die diese Methoden erfordern. Beinhaltet methodologische Debatten über die Validität und den interpretativen Wert computergestützter Literaturwissenschaften. Unterscheidet sich von der Korpuslinguistik und der Verarbeitung natürlicher Sprache, die in der Linguistik und Informatik angesiedelt sind.

Sub-topics

Core questions

  • Was kann eine groß angelegte quantitative Analyse aufdecken, was ein Close Reading nicht kann?
  • Wie zuverlässig und interpretierbar sind die Muster, die die Computergestützte Analyse in Texten findet?
  • Wie beeinflussen Korpuskonstruktion und Vorverarbeitung die Ergebnisse?
  • Wie sollte computergestützte Evidenz mit literarischer und historischer Interpretation in Beziehung stehen?

Key concepts

  • Distant Reading
  • Korpus
  • Merkmal
  • Statistisches Modell
  • Vorverarbeitung
  • Interpretation im großen Maßstab

Key theories

Distant Reading
Moretti schlug vor, Literatur durch großflächige Muster und Abstraktionen zu untersuchen, anstatt durch das Close Reading einiger kanonischer Werke, wodurch die Literaturgeschichte als ein Problem des Maßstabs neu definiert wurde.
Makroanalyse
Jockers argumentierte, dass digitale Methoden eine statistische Literaturgeschichte ganzer Korpora ermöglichen, die Einflüsse und stilistische Strukturen aufzeigt, die auf der Ebene einzelner Werke unsichtbar sind.
Modellierung literarischer Veränderungen
Underwood nutzte prädiktive Modellierungen großer Sammlungen, um zu argumentieren, dass Kategorien wie Genre und Prestige sich oft allmählich und kontinuierlich ändern.

History

Die Wurzeln liegen in der Konkordanz-Erstellung und den Geisteswissenschaftlichen Computeranwendungen Mitte des 20. Jahrhunderts. Morettis Distant Reading (2000er), Jockers' Macroanalysis (2013) und Underwoods Distant Horizons (2019) konsolidierten die computergestützten Literaturwissenschaften, während Das Kritik von 2019 die Debatte über statistische Genauigkeit und interpretativen Nutzen verschärfte.

Debates

Statistische Genauigkeit versus interpretativer Wert
Da argumentierte, dass viele computergestützte literarische Arbeiten statistisch schwach oder interpretativ dünn sind; Verteidiger behaupten, dass die Methoden bei sorgfältiger Anwendung tatsächlich neue Fragen aufwerfen.

Key figures

  • Franco Moretti
  • Matthew L. Jockers
  • Ted Underwood
  • Nan Z. Da

Related topics

Seminal works

  • moretti2013
  • jockers2013
  • underwood2019
  • da2019

Frequently asked questions

Wie unterscheidet sich dies von Korpuslinguistik oder NLP?
Es teilt Techniken mit der Korpuslinguistik und der Verarbeitung natürlicher Sprache, wird aber von humanistischen Fragen – Literaturgeschichte, Autorschaft, kultureller Wandel – angetrieben, anstatt von der Modellierung der Sprache selbst oder dem Aufbau von Anwendungen. Die interpretativen Ziele und die Debatten darüber sind charakteristisch für die Digital Humanities.

Methods for this concept

Related concepts