Кластеризація документів
Кластеризація документів — це завдання некерованого видобутку тексту, яке групує документи зі схожим змістом разом без використання будь-яких міток. Вона використовується для організації великих колекцій та для дослідницького аналізу, спираючись на корпус методів видобутку тексту, консолідованих Аггарвалом та Чжаєм (2012) та емпірично порівняних Штайнбахом, Каріпісом та Кумаром (2000).
Читати метод повністю
Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.
Method map
The neighbourhood of related methods — select a node to explore.
+1 more
Джерела
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
- Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗
Як цитувати цю сторінку
ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/uk/text-mining/document-clustering
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Вилучення ключових слівІнтелектуальний аналіз тексту↔ compare
- TF-IDFІнтелектуальний аналіз тексту↔ compare
- Тематичний аналізЯкісні дослідження↔ compare
- Тематичне моделюванняГлибоке навчання↔ compare
Згадується в
Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →