Process / pipeline

Hồi quy văn bản — Dự đoán số từ văn bản

Hồi quy dựa trên văn bản dự đoán một biến mục tiêu liên tục bằng cách sử dụng các đặc trưng trích xuất từ văn bản — điểm TF-IDF, embedding, hoặc n-gram — làm các biến độc lập. Dựa trên chương trình văn bản-như-dữ liệu được củng cố bởi Gentzkow, Kelly và Taddy (2019), nó cho phép ước tính một kết quả số như giá, xếp hạng, hoặc điểm cảm xúc trực tiếp từ tài liệu, và được sử dụng rộng rãi trong các ứng dụng khoa học xã hội, kinh tế và tài chính.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020
  2. Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/vi/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateText Regression (Text-Based Regression). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/text-mining/text-regression · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026