Клъстеризация на документи
Клъстеризацията на документи е задача за извличане на информация от текст без учител, която групира документи с подобно съдържание заедно, без да използва етикети. Тя се използва за организиране на големи колекции и за изследователски анализ, като се опира на корпуса от техники за извличане на информация от текст, консолидирани от Aggarwal и Zhai (2012) и сравнени емпирично от Steinbach, Karypis и Kumar (2000).
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
+1 more
Източници
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
- Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/bg/text-mining/document-clustering
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Извличане на ключови думиИзвличане на текст↔ compare
- TF-IDFИзвличане на текст↔ compare
- Тематичен анализКачествени изследвания↔ compare
- Тематично моделиранеДълбоко обучение↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →