ScholarGate
Asistenti
Process / pipeline

TF-IDF — Frekuenca e Termit–Frekuenca e Anasjelltë e Dokumentit

TF-IDF, i prezantuar nga Salton dhe Buckley (1988), është një skemë peshimi termash që vlerëson çdo fjalë në një dokument sipas shpeshtësisë së shfaqjes së saj aty dhe rrallësisë së saj në të gjithë koleksionin. Ai e shndërron tekstin bruto në vektorë dokumentesh të peshuar, duke i dhënë peshë të lartë termave që janë të shpeshtë në një dokument, por të pazakontë diku tjetër.

Hapeni në MethodMindSë shpejtiVideoSë shpejtiDownload slides

Lexoni metodën e plotë

Vetëm për anëtarët

Hyni me një llogari falas për ta lexuar këtë seksion.

Hyni

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

Burimet

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

Si ta citoni këtë faqe

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/sq/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Cituar nga

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). Marrë më 2026-06-15 nga https://scholargate.app/sq/text-mining/tf-idf · Seti i të dhënave: https://doi.org/10.5281/zenodo.20539026