Estilometría y atribución de autoría
Los escritores dejan huellas estadísticas. Las frecuencias de palabras pequeñas e inconscientes —"el", "de", "y"— varían poco dentro de la obra de un autor, pero difieren entre autores, y la estilometría explota esto para resolver disputas de autoría y para estudiar el estilo cuantitativamente.
Definition
El análisis estadístico de características medibles del estilo de escritura para caracterizar autores y atribuir textos de autoría incierta o disputada.
Scope
Cubre la medición cuantitativa del estilo literario y su uso en la atribución de textos a autores: la elección de características estilísticas, medidas de distancia y clasificación como el Delta de Burrows, y la validación de las afirmaciones de atribución. Incluye la historia del campo desde los Federalist Papers hasta los métodos modernos de aprendizaje automático, y sus aplicaciones forenses.
Core questions
- ¿Qué características textuales capturan mejor el estilo distintivo de un autor?
- ¿Cómo se pueden probar y validar las afirmaciones de atribución?
- ¿Por qué las frecuencias de las palabras funcionales son tan efectivas para la atribución?
- ¿Cuáles son los límites de la estilometría en géneros, períodos y traducciones?
Key concepts
- Palabras funcionales
- Delta de Burrows
- Selección de características
- Clasificación
- Validación cruzada
Key theories
- Frecuencia de palabras funcionales como señal autoral
- Mosteller y Wallace demostraron que las frecuencias de palabras funcionales comunes podían discriminar autores, utilizando inferencia bayesiana para atribuir los Federalist Papers en disputa.
- Delta de Burrows
- Burrows introdujo Delta, una medida de distancia sobre las palabras más frecuentes que se ha convertido en un método estándar y robusto para clasificar autores candidatos.
- Atribución moderna como clasificación
- Stamatatos examinó cómo la atribución de autoría se enmarca como un problema de clasificación de texto, comparando conjuntos de características y métodos de aprendizaje automático.
History
El estudio cuantitativo de la autoría se remonta al siglo XIX, pero el estudio de Mosteller y Wallace de 1964 sobre los Federalist Papers estableció el enfoque estadístico moderno. El Delta de Burrows (2002) proporcionó al campo una medida ampliamente adoptada, y estudios como el de Stamatatos (2009) mapearon el cambio hacia la clasificación por aprendizaje automático y el uso forense.
Debates
- Fiabilidad y confianza de las atribuciones
- Los métodos estilométricos pueden ser potentes pero sensibles al tamaño del corpus, el género y el preprocesamiento, lo que plantea preguntas sobre cuánta confianza merecen las atribuciones, especialmente en contextos forenses.
Key figures
- Frederick Mosteller
- David Wallace
- John Burrows
- Efstathios Stamatatos
Related topics
Seminal works
- mosteller1964
- burrows2002
- stamatatos2009
Frequently asked questions
- ¿Por qué centrarse en palabras pequeñas como 'el' en lugar de vocabulario distintivo?
- El vocabulario distintivo a menudo refleja el tema de un texto más que a su autor. Las palabras funcionales comunes se usan inconscientemente y a tasas estables dentro de la escritura de un autor, pero difieren entre autores, lo que las convierte en una señal de estilo confiable e independiente del tema.