ScholarGate
Assistent
Process / pipeline

TF-IDF — Term Frequency–Inverse Document Frequency

TF-IDF, geïntroduceerd door Salton en Buckley (1988), is een termwegingsschema dat elk woord in een document een score toekent op basis van hoe vaak het daar voorkomt en hoe zeldzaam het is in de gehele collectie. Het transformeert ruwe tekst naar gewogen documentvectoren, waarbij termen die frequent zijn in één document maar elders ongebruikelijk, een hoge weging krijgen.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

Bronnen

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

Deze pagina citeren

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/nl/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/text-mining/tf-idf · Gegevensset: https://doi.org/10.5281/zenodo.20539026