Process / pipeline

Текстова регресия — прогнозиране на числа от текст

Текстовата регресия прогнозира непрекъсната целева променлива, използвайки характеристики, извлечени от текст — TF-IDF резултати, вграждания (embeddings) или n-грами — като независими променливи. Надграждайки програмата „текст като данни“ (text-as-data), консолидирана от Gentzkow, Kelly и Taddy (2019), тя позволява числов резултат като цена, рейтинг или оценка на настроението да бъде оценен директно от документи и е широко използвана в приложения в социалните науки, икономиката и финансите.

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

Текстова регресия

BERT Embeddings Анализ на настроенията Класификация на текст TF-IDF Езиков модел N-грама

Източници

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

Как да цитирате тази страница

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/bg/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT EmbeddingsИзвличане на текст↔ compare
Анализ на настроениятаИзвличане на текст↔ compare
Класификация на текстИзвличане на текст↔ compare
TF-IDFИзвличане на текст↔ compare

Compare side by side →

Цитиран в

Езиков модел N-грама

Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →

Прочетете целия метод

Method map

Източници

Как да цитирате тази страница

Свързани методи

Which method?

Цитиран в