TF-IDF — Frekuenca e Termit–Frekuenca e Anasjelltë e Dokumentit
TF-IDF, i prezantuar nga Salton dhe Buckley (1988), është një skemë peshimi termash që vlerëson çdo fjalë në një dokument sipas shpeshtësisë së shfaqjes së saj aty dhe rrallësisë së saj në të gjithë koleksionin. Ai e shndërron tekstin bruto në vektorë dokumentesh të peshuar, duke i dhënë peshë të lartë termave që janë të shpeshtë në një dokument, por të pazakontë diku tjetër.
Lexoni metodën e plotë
Hyni me një llogari falas për ta lexuar këtë seksion.
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
Burimet
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
Si ta citoni këtë faqe
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/sq/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Analiza e ndjenjaveNxjerrja e tekstit↔ compare
- Klasifikimi i TekstitNxjerrja e tekstit↔ compare
- Word2VecNxjerrja e tekstit↔ compare
Cituar nga
Vutë re një problem në këtë faqe? Raportojeni ose sugjeroni një korrigjim →