Process / pipeline

Классификация текстов — Категоризация текстов

Классификация текстов, также известная как категоризация текстов, — это задача обучения с учителем в области обработки естественного языка, которая автоматически присваивает документы предопределенным категориям. Основываясь на подходе к категоризации текстов с использованием машин опорных векторов (support vector machine), разработанном Joachims (1998) и обобщенном в литературе по интеллектуальному анализу текстов (text mining) Aggarwal и Zhai (2012), она обеспечивает работу таких задач, как обнаружение спама и классификация тем, путем обучения на размеченных примерах.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

Классификация текстов

Кластеризация документов Извлечение ключевых слов Анализ тональности TF-IDF Извлечение аргументации Анализ тональности на ос…Атрибуция авторства (сти…Автоматизированная оценк…Автоматическая оценка те…Clinical Text Mining

+45 more

Источники

Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7

Как цитировать эту страницу

ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/ru/text-mining/text-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Кластеризация документовИнтеллектуальный анализ текста↔ compare
Извлечение ключевых словИнтеллектуальный анализ текста↔ compare
Анализ тональностиИнтеллектуальный анализ текста↔ compare
TF-IDFИнтеллектуальный анализ текста↔ compare

Compare side by side →

Упоминается в

Извлечение аргументации Анализ тональности на основе аспектов (ABSA)Атрибуция авторства (стилометрия)Автоматизированная оценка эссе (AES)Автоматическая оценка текста Clinical Text Mining Контент-анализ Контрастное обучение для обработки естественного языка Кросс-языковой анализ текстов Классификация речевых актов Дискурсивный парсинг Doc2Vec Адаптация домена Детекция эмоций в тексте Выявление событий Объяснимая модель тем LDA Детектирование фейковых новостей Few-Shot Text Classification Обнаружение гендерных предубеждений в НЛП Обнаружение галлюцинаций Детекция языка вражды Неявный сентимент-анализ Классификация намерений Идентификация языка (LID)Оценка лингвистической приемлемости Машинное понимание текста (Machine Reading Comprehension, MRC)Многодокументное реферирование N-граммная языковая модель Распознавание именованных сущностей (NER)Анализ мнений Обнаружение парафраз Промпт-инжиниринг Обнаружение пропаганды Обработка естественного языка (NLP)Анализ удобочитаемости Извлечение отношений Самостоятельно обучаемый анализ тональности Семантический разбор Анализ тональности Заполнение слотов Обработка естественного языка (NLP) в социальных сетях Детекция спекуляций Обнаружение позиции Обнаружение субъективности Оценка связности текста Дедупликация текстов Заполнение текста Регрессия на тексте Обусловленность текста TF-IDF Извлечение временной шкалы Word2Vec Нулевая классификация (Zero-Shot Classification)

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →

Читать метод полностью

Method map

Источники

Как цитировать эту страницу

Связанные методы

Which method?

Упоминается в