ScholarGate
Avustaja
Process / pipeline

Tekstiregressio – numeeristen arvojen ennustaminen tekstistä

Tekstipohjainen regressio ennustaa jatkuvaa kohdemuuttujaa käyttäen piirteinä tekstistä erotettuja tietoja – TF-IDF-pisteitä, upotuksia tai n-grammeja – selittävinä muuttujina. Gentzkow, Kelly ja Taddy (2019) vakiinnuttaman tekstidatan ohjelman pohjalta se mahdollistaa numeerisen lopputuloksen, kuten hinnan, arvion tai tunneskaalan, estimoinnin suoraan dokumenteista, ja sitä käytetään laajasti yhteiskuntatieteissä, taloustieteessä ja rahoituksessa.

Avaa sovelluksessa MethodMindTulossaVideoTulossaDownload slides

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Method map

The neighbourhood of related methods — select a node to explore.

Tekstiregressio – numeeristen arvojen ennustaminen tekstistä
BERT-upotukset – konteks…Sentiment AnalysisTekstinluokitteluTF-IDFN-gram-kielimalli

Lähteet

  1. Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020
  2. Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791

Näin viittaat tähän sivuun

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/fi/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Tähän viittaavat

ScholarGateText Regression (Text-Based Regression). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/text-mining/text-regression · Aineisto: https://doi.org/10.5281/zenodo.20539026