Process / pipeline

TF-IDF — Честота на термини — Обратна честота на документи

TF-IDF, въведен от Salton и Buckley (1988), е схема за претегляне на термини, която оценява всяка дума в документ според честотата на появяване в него и рядкостта ѝ в цялата колекция. Той преобразува суров текст в претеглени вектори на документи, като придава висока тежест на термини, които са чести в един документ, но необичайни в други.

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

TF-IDF

Анализ на настроенията Класификация на текст Word2Vec Анализ на съвместна поява Doc2Vec Клъстеризация на докумен…Детекция на фалшиви нови…GloVe Embeddings Извличане на ключови думи Лексикално разнообразие

+13 more

Източници

Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗

Как да цитирате тази страница

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/bg/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Анализ на настроениятаИзвличане на текст↔ compare
Класификация на текстИзвличане на текст↔ compare
Word2VecИзвличане на текст↔ compare

Compare side by side →

Цитиран в

Анализ на съвместна поява Doc2Vec Клъстеризация на документи Детекция на фалшиви новини GloVe Embeddings Извличане на ключови думи Лексикално разнообразие Оценка на лингвистична приемливост Морфологичен анализ Многодокументна сумаризация Езиков модел N-грама Тематично моделиране с NMF Анализ на четимост Семантична сходство Анализ на настроенията Обработка на естествен език (NLP) за социални медии Класификация на текст Дедупликация на текст Анализ на честотата на думите Текстова регресия Сегментиране на текст Тематично моделиране Word2Vec

Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →

Прочетете целия метод

Method map

Източници

Как да цитирате тази страница

Свързани методи

Which method?

Цитиран в