Классификация текстов — Категоризация текстов
Классификация текстов, также известная как категоризация текстов, — это задача обучения с учителем в области обработки естественного языка, которая автоматически присваивает документы предопределенным категориям. Основываясь на подходе к категоризации текстов с использованием машин опорных векторов (support vector machine), разработанном Joachims (1998) и обобщенном в литературе по интеллектуальному анализу текстов (text mining) Aggarwal и Zhai (2012), она обеспечивает работу таких задач, как обнаружение спама и классификация тем, путем обучения на размеченных примерах.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Method map
The neighbourhood of related methods — select a node to explore.
+45 more
Источники
- Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7
Как цитировать эту страницу
ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/ru/text-mining/text-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Кластеризация документовИнтеллектуальный анализ текста↔ compare
- Извлечение ключевых словИнтеллектуальный анализ текста↔ compare
- Анализ тональностиИнтеллектуальный анализ текста↔ compare
- TF-IDFИнтеллектуальный анализ текста↔ compare
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →