Process / pipeline

Hồi quy văn bản — Dự đoán số từ văn bản

Hồi quy dựa trên văn bản dự đoán một biến mục tiêu liên tục bằng cách sử dụng các đặc trưng trích xuất từ văn bản — điểm TF-IDF, embedding, hoặc n-gram — làm các biến độc lập. Dựa trên chương trình văn bản-như-dữ liệu được củng cố bởi Gentzkow, Kelly và Taddy (2019), nó cho phép ước tính một kết quả số như giá, xếp hạng, hoặc điểm cảm xúc trực tiếp từ tài liệu, và được sử dụng rộng rãi trong các ứng dụng khoa học xã hội, kinh tế và tài chính.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Hồi quy văn bản

BERT Embeddings Phân tích Cảm xúc Phân loại văn bản TF-IDF Mô hình ngôn ngữ N-gram

Nguồn tài liệu

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/vi/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT EmbeddingsKhai phá văn bản↔ compare
Phân tích Cảm xúcKhai phá văn bản↔ compare
Phân loại văn bảnKhai phá văn bản↔ compare
TF-IDFKhai phá văn bản↔ compare

Compare side by side →

Được tham chiếu bởi

Mô hình ngôn ngữ N-gram

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi