Process / pipeline
TF-IDF — תדירות מונח–הפוך תדירות מסמך
TF-IDF, שהוצג על ידי Salton ו-Buckley (1988), הוא מנגנון שקלול מונחים המדרג כל מילה במסמך לפי תדירות הופעתה שם ונדירותה בכלל האוסף. הוא הופך טקסט גולמי לווקטורי מסמך משוקללים, ומעניק משקל גבוה למונחים תכופים במסמך אחד אך נדירים במקומות אחרים.
קראו את השיטה במלואה
לחברים בלבד
התחברותהתחברו עם חשבון חינמי כדי לקרוא חלק זה.
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
מקורות
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
איך לצטט עמוד זה
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/he/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- ניתוח סנטימנטכריית טקסט↔ compare
- סיווג טקסטכריית טקסט↔ compare
- Word2Vecכריית טקסט↔ compare
מאוזכר על ידי
ניתוח שכיחות משותפתDoc2Vecמיון מסמכיםזיהוי חדשות כזבייצוגי GloVeחילוץ מילות מפתחעושר לקסיקליהערכת קבילות לשוניתניתוח מורפולוגיסיכום מרובה-מסמכיםמודל שפה מסוג N-gramמודל נושאי NMFניתוח קריאותדמיון סמנטיניתוח סנטימנטעיבוד שפה טבעית למדיה חברתיתסיווג טקסטגיבוב טקסטניתוח תדירות טקסטרגרסיית טקסטפילוח טקסטמידול נושאיםWord2Vec