Process / pipeline

Phân loại văn bản — Phân loại văn bản

Phân loại văn bản, còn gọi là phân loại văn bản, là một tác vụ xử lý ngôn ngữ tự nhiên có giám sát, tự động gán các tài liệu vào các danh mục định trước. Dựa trên phương pháp máy học hỗ trợ vector (support vector machine) cho phân loại văn bản được thiết lập bởi Joachims (1998) và củng cố trong tài liệu khai phá văn bản bởi Aggarwal và Zhai (2012), nó hỗ trợ các tác vụ như phát hiện thư rác và phân loại chủ đề bằng cách học từ các ví dụ đã gán nhãn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

+45 more

Nguồn tài liệu

  1. Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683
  2. Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/vi/text-mining/text-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

Khai thác lập luậnPhân tích tình cảm dựa trên khía cạnh (Aspect-Based Sentiment Analysis - ABSA)Phân loại tác giả (Phong cách học)Chấm điểm bài luận tự động (AES)Đánh giá văn bản tự độngKhai phá dữ liệu văn bản lâm sàngPhân tích nội dungHọc tương phản cho NLPPhân tích văn bản đa ngôn ngữPhân loại hành vi hội thoạiPhân tích diễn ngônDoc2VecThích nghi miềnPhát hiện cảm xúc trong văn bảnPhát hiện sự kiệnMô hình chủ đề LDA có khả năng giải thíchPhát hiện tin giảPhân loại văn bản với số lượng ví dụ ít (Few-Shot Text Classification)Phát hiện thiên vị giới trong NLPPhát hiện ảo giácPhát hiện ngôn từ kích động thù địchPhân tích cảm xúc ngầm – Phát hiện ý kiến phụ thuộc ngữ cảnhPhát hiện ý địnhNhận dạng ngôn ngữ (LID)Đánh giá tính chấp nhận ngôn ngữĐọc hiểu máy (MRC)Tóm tắt đa văn bảnMô hình ngôn ngữ N-gramNhận dạng thực thể có tên (NER)Khai thác ý kiếnPhát hiện Tương đương Ngữ nghĩaKỹ thuậtPromptPhát hiện Tuyên truyềnQuestion Answering (QA)Phân tích khả năng đọcTrích xuất quan hệPhân tích tình cảm tự giám sátPhân tích ngữ nghĩa – Từ ngôn ngữ tự nhiên đến biểu diễn hình thứcPhân tích Cảm xúcĐiền vào ô trốngXử lý ngôn ngữ tự nhiên trên mạng xã hộiPhát hiện suy đoánPhát hiện Quan điểmPhát hiện tính chủ quanTính điểm mạch lạc văn bảnKhử trùng văn bảnĐiền văn bảnHồi quy văn bảnSuy luận văn bảnTF-IDFTrích xuất Dòng thời gianWord2VecPhân loại không cần huấn luyện (Zero-Shot Classification)
ScholarGateText Classification (Text Classification (Text Categorization)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/text-mining/text-classification · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026