Hồi quy văn bản — Dự đoán số từ văn bản
Hồi quy dựa trên văn bản dự đoán một biến mục tiêu liên tục bằng cách sử dụng các đặc trưng trích xuất từ văn bản — điểm TF-IDF, embedding, hoặc n-gram — làm các biến độc lập. Dựa trên chương trình văn bản-như-dữ liệu được củng cố bởi Gentzkow, Kelly và Taddy (2019), nó cho phép ước tính một kết quả số như giá, xếp hạng, hoặc điểm cảm xúc trực tiếp từ tài liệu, và được sử dụng rộng rãi trong các ứng dụng khoa học xã hội, kinh tế và tài chính.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
- Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/vi/text-mining/text-regression
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsKhai phá văn bản↔ compare
- Phân tích Cảm xúcKhai phá văn bản↔ compare
- Phân loại văn bảnKhai phá văn bản↔ compare
- TF-IDFKhai phá văn bản↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →