Process / pipeline

Phân cụm tài liệu

Phân cụm tài liệu là một tác vụ khai thác văn bản không giám sát, nhóm các tài liệu có nội dung tương tự lại với nhau mà không sử dụng bất kỳ nhãn nào. Nó được sử dụng để tổ chức các bộ sưu tập lớn và cho phân tích thăm dò, dựa trên khối kỹ thuật khai thác văn bản được củng cố bởi Aggarwal và Zhai (2012) và so sánh thực nghiệm bởi Steinbach, Karypis và Kumar (2000).

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

Nguồn tài liệu

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/vi/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateDocument Clustering (Document Clustering). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/text-mining/document-clustering · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026