Process / pipeline

Tekstregrassie — Het voorspellen van getallen uit tekst

Tekstgebaseerde regressie voorspelt een continue doelvariabele met behulp van kenmerken die uit tekst zijn geëxtraheerd — TF-IDF-scores, embeddings of n-grammen — als de onafhankelijke variabelen. Voortbouwend op het tekst-als-data-programma, geconsolideerd door Gentzkow, Kelly en Taddy (2019), laat het een numerieke uitkomst zoals een prijs, een beoordeling of een sentiment score direct uit documenten schatten, en wordt het veel gebruikt in toepassingen in de sociale wetenschappen, economie en financiën.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Tekstregrassie

BERT-inbeddingen Sentimentanalyse Tekstclassificatie TF-IDF N-gram taalmodel

Bronnen

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

Deze pagina citeren

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/nl/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side →

Geciteerd door

N-gram taalmodel

Een fout op deze pagina gezien? Meld het of stel een correctie voor →

Lees de volledige methode

Method map

Bronnen

Deze pagina citeren

Verwante methoden

Which method?

Geciteerd door