Process / pipeline

Кластеризация документов

Кластеризация документов — это задача неконтролируемого интеллектуального анализа текстов, которая группирует документы со схожим содержанием без использования каких-либо меток. Она используется для организации больших коллекций и для разведочного анализа, опираясь на корпус методов интеллектуального анализа текстов, обобщенных Аггарвалом и Чжай (2012) и эмпирически сравненных Штайнбах, Карипис и Кумар (2000).

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

Источники

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

Как цитировать эту страницу

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/ru/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Упоминается в

ScholarGateDocument Clustering (Document Clustering). Получено 2026-06-15 из https://scholargate.app/ru/text-mining/document-clustering · Набор данных: https://doi.org/10.5281/zenodo.20539026