Phân loại văn bản — Phân loại văn bản
Phân loại văn bản, còn gọi là phân loại văn bản, là một tác vụ xử lý ngôn ngữ tự nhiên có giám sát, tự động gán các tài liệu vào các danh mục định trước. Dựa trên phương pháp máy học hỗ trợ vector (support vector machine) cho phân loại văn bản được thiết lập bởi Joachims (1998) và củng cố trong tài liệu khai phá văn bản bởi Aggarwal và Zhai (2012), nó hỗ trợ các tác vụ như phát hiện thư rác và phân loại chủ đề bằng cách học từ các ví dụ đã gán nhãn.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
+45 more
Nguồn tài liệu
- Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/vi/text-mining/text-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Phân cụm tài liệuKhai phá văn bản↔ compare
- Trích xuất từ khóaKhai phá văn bản↔ compare
- Phân tích Cảm xúcKhai phá văn bản↔ compare
- TF-IDFKhai phá văn bản↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →