Hesaplamalı Metin Analizi
Edebi ve tarihi sorular binlerce veya milyonlarca metin ölçeğinde sorulduğunda, hesaplama bir okuma yöntemi haline gelmektedir. Bu alan, dijital beşeri bilimlerin büyük metin korpuslarında (corpus) örüntüleri bulmak için kullandığı nicel teknikleri ve bu örüntülerin ne anlama geldiği üzerine süregelen canlı tartışmayı bir araya getirmektedir.
Tanım
Beşeri bilimler metinlerinin geniş koleksiyonlarına nicel ve hesaplamalı tekniklerin uygulanması; örüntüleri tespit etmek, edebi veya tarihi değişimi modellemek ve yakın okumanın ötesindeki ölçeklerde yorumsal sorular sormak amacıyla gerçekleştirilen bir alandır.
Kapsam
Beşeri bilimler metinlerine uygulanan nicel ve hesaplamalı yöntemleri kapsamaktadır: uzaktan okuma (distant reading) ve makroanaliz (macroanalysis), stilometri (stylometry) ve yazarlık atfı, konu modellemesi (topic modeling) ve metin madenciliği (text mining) ile bu yöntemlerin gerektirdiği korpusların oluşturulması. Hesaplamalı edebiyat çalışmalarının geçerliliği ve yorumsal değeri hakkındaki metodolojik tartışmaları da içermektedir. Dilbilim ve bilgisayar bilimleri alanlarında yer alan korpus dilbilimi (corpus linguistics) ve doğal dil işleme (natural language processing) disiplinlerinden farklılık göstermektedir.
Alt konular
Temel sorular
- Büyük ölçekli nicel analiz, yakın okumanın ortaya koyamadığı neleri açığa çıkarabilir?
- Hesaplamanın metinlerde bulduğu örüntüler ne kadar güvenilir ve yorumlanabilirdir?
- Korpus oluşturma ve ön işleme (preprocessing) süreçleri sonuçları nasıl şekillendirmektedir?
- Hesaplamalı kanıtlar, edebi ve tarihi yorumlamayla nasıl ilişkilendirilmelidir?
Anahtar kavramlar
- Uzaktan okuma (Distant reading)
- Korpus (Corpus)
- Özellik (Feature)
- İstatistiksel model
- Ön işleme (Preprocessing)
- Ölçekli yorumlama
Temel kuramlar
- Uzaktan okuma (Distant reading)
- Moretti, edebiyatı kanonik birkaç eserin yakın okuması yerine, büyük ölçekli örüntüler ve soyutlamalar aracılığıyla incelemeyi önermiş, edebiyat tarihini bir ölçek sorunu olarak yeniden çerçevelemiştir.
- Makroanaliz (Macroanalysis)
- Jockers, dijital yöntemlerin tüm korpusların istatistiksel bir edebiyat tarihini mümkün kıldığını, tekil eserler düzeyinde görünmez olan etki ve stilistik yapıyı ortaya çıkardığını savunmuştur.
- Edebi değişimi modelleme
- Underwood, büyük koleksiyonların tahmine dayalı modellemesini kullanarak, tür ve prestij gibi kategorilerin genellikle kademeli ve sürekli bir şekilde değiştiğini öne sürmüştür.
Tarihçe
Kökleri yirminci yüzyıl ortalarındaki konkordans (concordance) oluşturma ve beşeri bilimler bilişimine dayanmaktadır. Moretti'nin uzaktan okuma (2000'ler), Jockers'ın Makroanaliz (2013) ve Underwood'un Distant Horizons (2019) çalışmaları, hesaplamalı edebiyat çalışmalarını pekiştirmiştir. Da'nın 2019'daki eleştirisi ise istatistiksel titizlik ve yorumsal getiri üzerine olan tartışmayı keskinleştirmiştir.
Tartışmalar
- İstatistiksel titizlik ve yorumsal değer
- Da, hesaplamalı edebiyat çalışmalarının çoğunun istatistiksel olarak zayıf veya yorumsal açıdan yetersiz olduğunu savunmuştur; savunucuları ise bu yöntemlerin dikkatli kullanıldığında gerçekten yeni sorulara kapı araladığını iddia etmektedir.
Öne çıkan isimler
- Franco Moretti
- Matthew L. Jockers
- Ted Underwood
- Nan Z. Da
İlgili konular
Temel eserler
- moretti2013
- jockers2013
- underwood2019
- da2019
Sıkça sorulan sorular
- Bu, korpus dilbilimi veya NLP'den nasıl farklıdır?
- Korpus dilbilimi ve doğal dil işleme ile teknikleri paylaşmakla birlikte, dilin kendisini modellemek veya uygulamalar geliştirmek yerine, edebi tarih, yazarlık, kültürel değişim gibi beşeri sorular tarafından yönlendirilmektedir. Yorumlama hedefleri ve bunlar hakkındaki tartışmalar, dijital beşeri bilimlerin karakteristik özellikleridir.