Process / pipeline

Shlukování dokumentů

Shlukování dokumentů je úloha netextového dolování (unsupervised text-mining), která seskupuje dokumenty s podobným obsahem dohromady bez použití jakýchkoli popisků. Používá se k organizaci velkých sbírek a pro explorativní analýzu, přičemž čerpá z korpusu technik dolování textu konsolidovaných Aggarwallem a Zhaiem (2012) a empiricky porovnaných Steinbachem, Karypisem a Kumarem (2000).

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

Zdroje

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

Jak citovat tuto stránku

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/cs/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazuje sem

ScholarGateDocument Clustering (Document Clustering). Získáno 2026-06-15 z https://scholargate.app/cs/text-mining/document-clustering · Datová sada: https://doi.org/10.5281/zenodo.20539026