Stilometrie und Autorenzuweisung
Autoren hinterlassen statistische Fingerabdrücke. Die Häufigkeiten kleiner, unbewusster Wörter – der, die, und – variieren innerhalb des Werks eines Autors nur wenig, unterscheiden sich aber zwischen Autoren. Die Stilometrie nutzt dies, um umstrittene Autorschaften zu klären und den Stil quantitativ zu untersuchen.
Definition
Die statistische Analyse messbarer Merkmale des Schreibstils zur Charakterisierung von Autoren und zur Zuweisung von Texten unsicherer oder umstrittener Autorschaft.
Scope
Umfasst die quantitative Messung des literarischen Stils und dessen Verwendung bei der Zuweisung von Texten zu Autoren: die Auswahl stilistischer Merkmale, Distanz- und Klassifikationsmaße wie Burrows' Delta sowie die Validierung von Zuweisungsansprüchen. Beinhaltet die Geschichte des Fachgebiets von den Federalist Papers bis zu modernen Methoden des maschinellen Lernens und deren forensische Anwendungen.
Core questions
- Welche textuellen Merkmale erfassen den unverwechselbaren Stil eines Autors am besten?
- Wie können Zuweisungsansprüche getestet und validiert werden?
- Warum sind Funktionsworthäufigkeiten für die Zuweisung so effektiv?
- Was sind die Grenzen der Stilometrie über Genres, Epochen und Übersetzungen hinweg?
Key concepts
- Funktionswörter
- Burrows' Delta
- Merkmalsauswahl
- Klassifikation
- Kreuzvalidierung
Key theories
- Funktionsworthäufigkeit als Autorensignal
- Mosteller und Wallace zeigten, dass die Häufigkeiten gängiger Funktionswörter Autoren unterscheiden können, indem sie Bayes'sche Inferenz zur Zuweisung der umstrittenen Federalist Papers nutzten.
- Burrows' Delta
- Burrows führte Delta ein, ein Distanzmaß über die häufigsten Wörter, das zu einer standardmäßigen, robusten Methode zur Rangfolge von Kandidatenautoren geworden ist.
- Moderne Zuweisung als Klassifikation
- Stamatatos untersuchte, wie die Autorschaftszuweisung als Textklassifikationsproblem formuliert wird, wobei Merkmalsmengen und Methoden des maschinellen Lernens verglichen werden.
History
Die quantitative Autorschaftsforschung reicht bis ins 19. Jahrhundert zurück, doch Mosteller und Wallaces Studie von 1964 über die Federalist Papers etablierte den modernen statistischen Ansatz. Burrows' Delta (2002) lieferte dem Fachgebiet ein weit verbreitetes Maß, und Übersichten wie die von Stamatatos (2009) zeigten den Wandel hin zur Klassifikation mittels maschinellem Lernen und zur forensischen Nutzung auf.
Debates
- Zuverlässigkeit und Vertrauen in Zuweisungen
- Stilometrische Methoden können mächtig, aber auch empfindlich gegenüber Korpusgröße, Genre und Vorverarbeitung sein, was Fragen aufwirft, wie viel Vertrauen Zuweisungen verdienen, insbesondere in forensischen Kontexten.
Key figures
- Frederick Mosteller
- David Wallace
- John Burrows
- Efstathios Stamatatos
Related topics
Seminal works
- mosteller1964
- burrows2002
- stamatatos2009
Frequently asked questions
- Warum konzentriert man sich auf kleine Wörter wie „der“ anstatt auf unverwechselbaren Wortschatz?
- Unverwechselbarer Wortschatz spiegelt oft das Thema eines Textes wider und nicht seinen Autor. Häufige Funktionswörter werden unbewusst und mit stabilen Raten innerhalb des Schreibens eines Autors verwendet, unterscheiden sich aber zwischen Autoren, was sie zu einem zuverlässigen, themenunabhängigen Stilsignal macht.