Phân cụm tài liệu
Phân cụm tài liệu là một tác vụ khai thác văn bản không giám sát, nhóm các tài liệu có nội dung tương tự lại với nhau mà không sử dụng bất kỳ nhãn nào. Nó được sử dụng để tổ chức các bộ sưu tập lớn và cho phân tích thăm dò, dựa trên khối kỹ thuật khai thác văn bản được củng cố bởi Aggarwal và Zhai (2012) và so sánh thực nghiệm bởi Steinbach, Karypis và Kumar (2000).
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
+1 more
Nguồn tài liệu
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
- Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/vi/text-mining/document-clustering
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Trích xuất từ khóaKhai phá văn bản↔ compare
- TF-IDFKhai phá văn bản↔ compare
- Thematic AnalysisNghiên cứu định tính↔ compare
- Topic Modeling (Mô hình hóa chủ đề)Học sâu↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →