Tekstregrassie — Het voorspellen van getallen uit tekst
Tekstgebaseerde regressie voorspelt een continue doelvariabele met behulp van kenmerken die uit tekst zijn geëxtraheerd — TF-IDF-scores, embeddings of n-grammen — als de onafhankelijke variabelen. Voortbouwend op het tekst-als-data-programma, geconsolideerd door Gentzkow, Kelly en Taddy (2019), laat het een numerieke uitkomst zoals een prijs, een beoordeling of een sentiment score direct uit documenten schatten, en wordt het veel gebruikt in toepassingen in de sociale wetenschappen, economie en financiën.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
- Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗
Deze pagina citeren
ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/nl/text-mining/text-regression
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-inbeddingenText mining↔ compare
- SentimentanalyseText mining↔ compare
- TekstclassificatieText mining↔ compare
- TF-IDFText mining↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →