Análisis Computacional de Textos
Cuando las preguntas literarias e históricas se plantean a la escala de miles o millones de textos, la computación se convierte en un método de lectura. Esta área reúne las técnicas cuantitativas que las humanidades digitales utilizan para encontrar patrones en grandes corpus textuales, y el animado debate sobre lo que significan esos patrones.
Definition
La aplicación de técnicas cuantitativas y computacionales a grandes colecciones de textos de humanidades con el fin de detectar patrones, modelar el cambio literario o histórico, y plantear preguntas interpretativas a escalas que van más allá de la lectura atenta.
Scope
Cubre métodos cuantitativos y computacionales aplicados a textos de humanidades: lectura distante y macroanálisis, estilometría y atribución de autoría, modelado de temas y minería de textos, y la construcción de los corpus que estos métodos requieren. Incluye debates metodológicos sobre la validez y el valor interpretativo de los estudios literarios computacionales. Se distingue de la lingüística de corpus y el procesamiento del lenguaje natural, que se sitúan en la lingüística y la informática.
Sub-topics
Core questions
- ¿Qué puede revelar el análisis cuantitativo a gran escala que la lectura atenta no puede?
- ¿Qué tan fiables e interpretables son los patrones que la computación encuentra en los textos?
- ¿Cómo influyen la construcción del corpus y el preprocesamiento en los resultados?
- ¿Cómo debe relacionarse la evidencia computacional con la interpretación literaria e histórica?
Key concepts
- Lectura distante
- Corpus
- Característica
- Modelo estadístico
- Preprocesamiento
- Interpretación a escala
Key theories
- Lectura distante
- Moretti propuso estudiar la literatura a través de patrones y abstracciones a gran escala en lugar de la lectura atenta de unos pocos canónicos, redefiniendo la historia literaria como un problema de escala.
- Macroanálisis
- Jockers argumentó que los métodos digitales permiten una historia literaria estadística de corpus enteros, revelando influencias y estructuras estilísticas invisibles a nivel de obras individuales.
- Modelado del cambio literario
- Underwood utilizó el modelado predictivo de grandes colecciones para argumentar que categorías como el género y el prestigio a menudo cambian de forma gradual y continua.
History
Sus raíces se encuentran en la construcción de concordancias y la informática humanística de mediados del siglo XX. La lectura distante de Moretti (década de 2000), el Macroanálisis de Jockers (2013) y los Horizontes Distantes de Underwood (2019) consolidaron los estudios literarios computacionales, mientras que la crítica de Da en 2019 agudizó el debate sobre el rigor estadístico y el rendimiento interpretativo.
Debates
- Rigor estadístico versus valor interpretativo
- Da argumentó que gran parte del trabajo literario computacional es estadísticamente débil o interpretativamente superficial; los defensores sostienen que los métodos abren preguntas genuinamente nuevas cuando se usan con cuidado.
Key figures
- Franco Moretti
- Matthew L. Jockers
- Ted Underwood
- Nan Z. Da
Related topics
Seminal works
- moretti2013
- jockers2013
- underwood2019
- da2019
Frequently asked questions
- ¿En qué se diferencia esto de la lingüística de corpus o el PNL?
- Comparte técnicas con la lingüística de corpus y el procesamiento del lenguaje natural, pero está impulsado por preguntas humanísticas —historia literaria, autoría, cambio cultural— en lugar de modelar el lenguaje en sí o construir aplicaciones. Los objetivos interpretativos, y los debates sobre ellos, son característicos de las humanidades digitales.