Process / pipeline

מיון מסמכים

מיון מסמכים (Document clustering) הוא משימת כריית טקסט בלתי מונחית (unsupervised) המקבצת מסמכים בעלי תוכן דומה יחדיו, ללא שימוש בתיוגים כלשהם. היא משמשת לארגון אוספים גדולים ולניתוח חקרני, תוך הסתמכות על גוף טכניקות כריית הטקסט שאוגר אגרוואל וזאי (Aggarwal and Zhai, 2012) והושוו אמפירית על ידי שטיינבאך, קריפיס וקומר (Steinbach, Karypis and Kumar, 2000).

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

+1 more

מקורות

  1. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
  2. Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link

איך לצטט עמוד זה

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/he/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

מאוזכר על ידי

ScholarGateDocument Clustering (Document Clustering). אוחזר בתאריך 2026-06-15 מתוך https://scholargate.app/he/text-mining/document-clustering · מערך נתונים: https://doi.org/10.5281/zenodo.20539026