Текстова регресия — прогнозиране на числа от текст
Текстовата регресия прогнозира непрекъсната целева променлива, използвайки характеристики, извлечени от текст — TF-IDF резултати, вграждания (embeddings) или n-грами — като независими променливи. Надграждайки програмата „текст като данни“ (text-as-data), консолидирана от Gentzkow, Kelly и Taddy (2019), тя позволява числов резултат като цена, рейтинг или оценка на настроението да бъде оценен директно от документи и е широко използвана в приложения в социалните науки, икономиката и финансите.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Източници
- Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
- Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗
Как да цитирате тази страница
ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/bg/text-mining/text-regression
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsИзвличане на текст↔ compare
- Анализ на настроениятаИзвличане на текст↔ compare
- Класификация на текстИзвличане на текст↔ compare
- TF-IDFИзвличане на текст↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →