Process / pipeline
文本分类 — 文本归类
文本分类(Text classification),亦称文本归类(text categorization),是一项监督式自然语言处理任务,旨在自动将文档分配到预定义的类别中。该方法借鉴了 Joachims (1998) 建立的用于文本归类的支持向量机方法,并由 Aggarwal 和 Zhai (2012) 在文本挖掘文献中加以巩固,通过从标记示例中学习,为垃圾邮件检测和主题分类等任务提供支持。
阅读完整方法
仅限会员
登录使用免费账户登录即可阅读本节。
Method map
The neighbourhood of related methods — select a node to explore.
+45 more
来源
- Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
- Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7
如何引用本页
ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/zh/text-mining/text-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →被引用于
论证挖掘基于方面的情感分析 (ABSA)作者归属(文体计量学)自动论文评分 (AES)自动文本评估临床文本挖掘内容分析对比学习在自然语言处理中的应用跨语言文本分析对话行为分类语篇分析Doc2Vec领域适应文本情感检测事件检测可解释的LDA主题模型假新闻检测少样本文本分类NLP中的性别偏见检测幻觉检测仇恨言论检测隐式情感分析意图检测语言识别(LID)语言可接受性评估机器阅读理解 (MRC)多文档摘要N-gram语言模型命名实体识别 (NER)观点挖掘释义检测提示工程宣传检测问答 (QA)可读性分析关系抽取自监督情感分析语义解析情感分析槽填充社交媒体自然语言处理投机检测立场检测主观性检测文本连贯性评分文本去重文本填空文本回归文本蕴涵TF-IDF时间线抽取Word2Vec零样本分类