ScholarGate
Assistent
Process / pipeline

Tekstregrassie — Het voorspellen van getallen uit tekst

Tekstgebaseerde regressie voorspelt een continue doelvariabele met behulp van kenmerken die uit tekst zijn geëxtraheerd — TF-IDF-scores, embeddings of n-grammen — als de onafhankelijke variabelen. Voortbouwend op het tekst-als-data-programma, geconsolideerd door Gentzkow, Kelly en Taddy (2019), laat het een numerieke uitkomst zoals een prijs, een beoordeling of een sentiment score direct uit documenten schatten, en wordt het veel gebruikt in toepassingen in de sociale wetenschappen, economie en financiën.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020
  2. Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791

Deze pagina citeren

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/nl/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateText Regression (Text-Based Regression). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/text-mining/text-regression · Gegevensset: https://doi.org/10.5281/zenodo.20539026