Process / pipeline

Regresia pe bază de text — Prezicerea numerelor din text

Regresia bazată pe text prezice o variabilă țintă continuă utilizând caracteristici extrase din text — scoruri TF-IDF, embedding-uri sau n-grame — ca variabile independente. Bazându-se pe programul text-ca-date consolidat de Gentzkow, Kelly și Taddy (2019), permite estimarea unui rezultat numeric, cum ar fi un preț, o evaluare sau un scor de sentiment, direct din documente, și este utilizat pe scară largă în aplicații din științele sociale, economie și finanțe.

Deschide în MethodMindÎn curândVideoÎn curândDownload slides

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Method map

The neighbourhood of related methods — select a node to explore.

Regresia pe bază de text

Embeddings BERT Analiza sentimentelor Clasificarea textului TF-IDF Model lingvistic n-gram

Surse

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

Cum se citează această pagină

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/ro/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Embeddings BERTMineritul textelor↔ compare
Analiza sentimentelorMineritul textelor↔ compare
Clasificarea textuluiMineritul textelor↔ compare
TF-IDFMineritul textelor↔ compare

Compare side by side →

Citat de

Model lingvistic n-gram

Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →

Citește metoda completă

Method map

Surse

Cum se citează această pagină

Metode înrudite

Which method?

Citat de