Process / pipeline

מיון מסמכים

מיון מסמכים (Document clustering) הוא משימת כריית טקסט בלתי מונחית (unsupervised) המקבצת מסמכים בעלי תוכן דומה יחדיו, ללא שימוש בתיוגים כלשהם. היא משמשת לארגון אוספים גדולים ולניתוח חקרני, תוך הסתמכות על גוף טכניקות כריית הטקסט שאוגר אגרוואל וזאי (Aggarwal and Zhai, 2012) והושוו אמפירית על ידי שטיינבאך, קריפיס וקומר (Steinbach, Karypis and Kumar, 2000).

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

מיון מסמכים

חילוץ מילות מפתח TF-IDF Thematic Analysis מידול נושאים BERTopic מודל נושאי NMF דמיון סמנטי סיווג טקסט סיכום טקסט מידול נושאים

+1 more

מקורות

Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227
Steinbach, M., Karypis, G. & Kumar, V. (2000). A Comparison of Document Clustering Techniques. KDD Workshop on Text Mining. link ↗

איך לצטט עמוד זה

ScholarGate. (2026, June 1). Document Clustering. ScholarGate. https://scholargate.app/he/text-mining/document-clustering

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

חילוץ מילות מפתחכריית טקסט↔ compare
TF-IDFכריית טקסט↔ compare
Thematic Analysisמחקר איכותני↔ compare
מידול נושאיםלמידה עמוקה↔ compare

Compare side by side →

מאוזכר על ידי

BERTopic מודל נושאי NMF דמיון סמנטי סיווג טקסט סיכום טקסט מידול נושאים Word2Vec

מצאתם בעיה בעמוד זה? דווחו או הציעו תיקון →

קראו את השיטה במלואה

Method map

מקורות

איך לצטט עמוד זה

שיטות קשורות

Which method?

מאוזכר על ידי