Tekstregressioon — numbrite ennustamine tekstist
Tekstipõhine regressioon ennustab pidevat sihtmuutujat, kasutades sõltumatute muutujatena tekstist eraldatud tunnuseid – TF-IDF skoore, esitusi või n-gramme. Tuginedes Gentzkowi, Kelly ja Taddy (2019) konsolideeritud tekst-andmetena programmile, võimaldab see otseselt dokumentidest hinnata numbrilist tulemust, nagu hind, hinnang või sentimentiskoor, ning seda kasutatakse laialdaselt sotsiaalteadustes, majanduses ja finantsrakendustes.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
- Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
- Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/et/text-mining/text-regression
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-i manusedTekstikaeve↔ compare
- SentimentanalüüsTekstikaeve↔ compare
- Teksti klassifitseerimineTekstikaeve↔ compare
- TF-IDFTekstikaeve↔ compare
Sellele viitavad
Märkasid sellel lehel viga? Teata sellest või paku parandust →