Process / pipeline

文本分类 — 文本归类

文本分类（Text classification），亦称文本归类（text categorization），是一项监督式自然语言处理任务，旨在自动将文档分配到预定义的类别中。该方法借鉴了 Joachims (1998) 建立的用于文本归类的支持向量机方法，并由 Aggarwal 和 Zhai (2012) 在文本挖掘文献中加以巩固，通过从标记示例中学习，为垃圾邮件检测和主题分类等任务提供支持。

在 MethodMind 中打开即将推出视频即将推出Download slides

阅读完整方法

仅限会员

使用免费账户登录即可阅读本节。

Method map

The neighbourhood of related methods — select a node to explore.

文本分类

文档聚类关键词提取情感分析 TF-IDF 论证挖掘基于方面的情感分析 (ABSA)作者归属（文体计量学）自动论文评分 (AES)自动文本评估临床文本挖掘

+45 more

来源

Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7

如何引用本页

ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/zh/text-mining/text-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side →

被引用于

论证挖掘基于方面的情感分析 (ABSA)作者归属（文体计量学）自动论文评分 (AES)自动文本评估临床文本挖掘内容分析对比学习在自然语言处理中的应用跨语言文本分析对话行为分类语篇分析 Doc2Vec 领域适应文本情感检测事件检测可解释的LDA主题模型假新闻检测少样本文本分类 NLP中的性别偏见检测幻觉检测仇恨言论检测隐式情感分析意图检测语言识别（LID）语言可接受性评估机器阅读理解 (MRC)多文档摘要 N-gram语言模型命名实体识别 (NER)观点挖掘释义检测提示工程宣传检测问答 (QA)可读性分析关系抽取自监督情感分析语义解析情感分析槽填充社交媒体自然语言处理投机检测立场检测主观性检测文本连贯性评分文本去重文本填空文本回归文本蕴涵 TF-IDF 时间线抽取 Word2Vec 零样本分类

发现本页有问题？报告或提出修改建议 →

阅读完整方法

Method map

来源

如何引用本页

相关方法

Which method?

被引用于