ScholarGate
Avustaja
Process / pipeline

Dokumenttien klusterointi

Dokumenttien klusterointi on ohjaamaton tekstinlouhinnan tehtävä, joka ryhmittelee samankaltaista sisältöä sisältävät dokumentit yhteen ilman minkäänlaisia tunnisteita. Sitä käytetään suurten kokoelmien järjestämiseen ja eksploratiiviseen analyysiin, hyödyntäen Aggarwalin ja Zhai'n (2012) kokoamia ja Steinbachin, Karypis'n ja Kumarin (2000) empiirisesti vertailemia tekstinlouhinnan tekniikoita.

Avaa sovelluksessa MethodMindTulossaVideoTulossaDownload slides

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

Lähteet

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

Näin viittaat tähän sivuun

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/fi/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Tähän viittaavat

ScholarGateDocument Clustering (Document Clustering). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/text-mining/document-clustering · Aineisto: https://doi.org/10.5281/zenodo.20539026