Process / pipeline

Клъстеризация на документи

Клъстеризацията на документи е задача за извличане на информация от текст без учител, която групира документи с подобно съдържание заедно, без да използва етикети. Тя се използва за организиране на големи колекции и за изследователски анализ, като се опира на корпуса от техники за извличане на информация от текст, консолидирани от Aggarwal и Zhai (2012) и сравнени емпирично от Steinbach, Karypis и Kumar (2000).

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

Източници

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

Как да цитирате тази страница

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/bg/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Цитиран в

ScholarGateDocument Clustering (Document Clustering). Извлечено на 2026-06-15 от https://scholargate.app/bg/text-mining/document-clustering · Набор от данни: https://doi.org/10.5281/zenodo.20539026