Кластеризация документов
Кластеризация документов — это задача неконтролируемого интеллектуального анализа текстов, которая группирует документы со схожим содержанием без использования каких-либо меток. Она используется для организации больших коллекций и для разведочного анализа, опираясь на корпус методов интеллектуального анализа текстов, обобщенных Аггарвалом и Чжай (2012) и эмпирически сравненных Штайнбах, Карипис и Кумар (2000).
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Method map
The neighbourhood of related methods — select a node to explore.
+1 more
Источники
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
- Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗
Как цитировать эту страницу
ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/ru/text-mining/document-clustering
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Извлечение ключевых словИнтеллектуальный анализ текста↔ compare
- TF-IDFИнтеллектуальный анализ текста↔ compare
- Тематический анализКачественные исследования↔ compare
- Тематическое моделированиеГлубокое обучение↔ compare
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →