TF-IDF — Freqüència de Terme–Freqüència Inversa de Document
TF-IDF, introduït per Salton i Buckley (1988), és un esquema de ponderació de termes que puntua cada paraula d'un document segons la freqüència amb què hi apareix i la seva raresa a tota la col·lecció. Transforma text brut en vectors de documents ponderats, atorgant un pes elevat als termes que són freqüents en un document però poc comuns en altres llocs.
Llegeix el mètode complet
Inicia la sessió amb un compte gratuït per llegir aquesta secció.
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
Fonts
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
Com citar aquesta pàgina
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/ca/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Anàlisi de sentimentsMineria de text↔ compare
- Classificació de textMineria de text↔ compare
- Word2VecMineria de text↔ compare
Citat per
Has vist cap problema en aquesta pàgina? Informa'n o suggereix una correcció →