TF-IDF — Frecuencia de Término–Frecuencia Inversa de Documento
TF-IDF, introducido por Salton y Buckley (1988), es un esquema de ponderación de términos que califica cada palabra en un documento según la frecuencia con la que aparece allí y lo rara que es en toda la colección. Convierte texto sin formato en vectores de documentos ponderados, asignando un peso alto a los términos que son frecuentes en un documento pero infrecuentes en otros.
Leer el método completo
Inicia sesión con una cuenta gratuita para leer esta sección.
Mapa de métodos
El vecindario de métodos relacionados: selecciona un nodo para explorarlo.
+13 más
Fuentes
- Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗
Cómo citar esta página
ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/es/text-mining/tf-idf
¿Qué método?
Coloca este método junto a sus parientes más cercanos y léelos lado a lado: la biblioteca pone los libros sobre la mesa; la elección es tuya.
- Análisis de SentimientoMinería de texto↔ comparar
- Clasificación de TextoMinería de texto↔ comparar
- Word2VecMinería de texto↔ comparar
Citado por
¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →