ScholarGate
Assistente
Process / pipeline

TF-IDF — Frequenza del Termine–Frequenza Inversa del Documento

Il TF-IDF, introdotto da Salton e Buckley (1988), è uno schema di ponderazione dei termini che assegna un punteggio a ciascuna parola in un documento in base alla frequenza con cui appare in esso e alla sua rarità nell'intera collezione. Trasforma il testo grezzo in vettori di documenti ponderati, assegnando un peso elevato ai termini che sono frequenti in un documento ma rari altrove.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

Fonti

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

Come citare questa pagina

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/it/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). Consultato il 2026-06-15 da https://scholargate.app/it/text-mining/tf-idf · Insieme di dati: https://doi.org/10.5281/zenodo.20539026