Process / pipeline

TF-IDF — Frequenza del Termine–Frequenza Inversa del Documento

Il TF-IDF, introdotto da Salton e Buckley (1988), è uno schema di ponderazione dei termini che assegna un punteggio a ciascuna parola in un documento in base alla frequenza con cui appare in esso e alla sua rarità nell'intera collezione. Trasforma il testo grezzo in vettori di documenti ponderati, assegnando un peso elevato ai termini che sono frequenti in un documento ma rari altrove.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

TF-IDF

Analisi del Sentimento Classificazione del testo Word2Vec Analisi di Co-occorrenza Doc2Vec Clustering di documenti Rilevamento di Fake News Embedding di parole GloVe Estrazione di parole chi…Diversità Lessicale

+13 more

Fonti

Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗

Come citare questa pagina

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/it/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Analisi del SentimentoText mining↔ compare
Classificazione del testoText mining↔ compare
Word2VecText mining↔ compare

Compare side by side →

Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →

Leggi il metodo completo

Method map

Fonti

Come citare questa pagina

Metodi correlati

Which method?

Citato da