Process / pipeline
מיון מסמכים
מיון מסמכים (Document clustering) הוא משימת כריית טקסט בלתי מונחית (unsupervised) המקבצת מסמכים בעלי תוכן דומה יחדיו, ללא שימוש בתיוגים כלשהם. היא משמשת לארגון אוספים גדולים ולניתוח חקרני, תוך הסתמכות על גוף טכניקות כריית הטקסט שאוגר אגרוואל וזאי (Aggarwal and Zhai, 2012) והושוו אמפירית על ידי שטיינבאך, קריפיס וקומר (Steinbach, Karypis and Kumar, 2000).
קראו את השיטה במלואה
לחברים בלבד
התחברותהתחברו עם חשבון חינמי כדי לקרוא חלק זה.
Method map
The neighbourhood of related methods — select a node to explore.
+1 more
מקורות
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
- Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗
איך לצטט עמוד זה
ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/he/text-mining/document-clustering
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- חילוץ מילות מפתחכריית טקסט↔ compare
- TF-IDFכריית טקסט↔ compare
- Thematic Analysisמחקר איכותני↔ compare
- מידול נושאיםלמידה עמוקה↔ compare