TF-IDF — Frequenza del Termine–Frequenza Inversa del Documento
Il TF-IDF, introdotto da Salton e Buckley (1988), è uno schema di ponderazione dei termini che assegna un punteggio a ciascuna parola in un documento in base alla frequenza con cui appare in esso e alla sua rarità nell'intera collezione. Trasforma il testo grezzo in vettori di documenti ponderati, assegnando un peso elevato ai termini che sono frequenti in un documento ma rari altrove.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
+13 more
Fonti
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
Come citare questa pagina
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/it/text-mining/tf-idf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Analisi del SentimentoText mining↔ compare
- Classificazione del testoText mining↔ compare
- Word2VecText mining↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →