Regression ya Maandishi — Kutabiri Nambari Kutoka kwa Maandishi
Regression ya maandishi hutabiri kigezo lengwa kinachoendelea kwa kutumia vipengele vilivyotolewa kutoka kwa maandishi — alama za TF-IDF, embeddings, au n-grams — kama vigezo huru. Kwa kujenga juu ya mpango wa maandishi-kama-data uliowekwa na Gentzkow, Kelly na Taddy (2019), huruhusu matokeo ya nambari kama vile bei, kiwango, au alama ya hisia kuhesabiwa moja kwa moja kutoka kwa hati, na hutumiwa sana katika matumizi ya sayansi ya jamii, uchumi, na fedha.
Soma mbinu kamili
Ingia kwa akaunti ya bure ili kusoma sehemu hii.
Method map
The neighbourhood of related methods — select a node to explore.
Vyanzo
- Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
- Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗
Jinsi ya kunukuu ukurasa huu
ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/sw/text-mining/text-regression
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsUchimbaji wa Matini↔ compare
- Uchanganuzi wa HisiaUchimbaji wa Matini↔ compare
- Uainishaji wa MaandishiUchimbaji wa Matini↔ compare
- TF-IDFUchimbaji wa Matini↔ compare
Imerejelewa na
Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →