Process / pipeline

Phân loại văn bản — Phân loại văn bản

Phân loại văn bản, còn gọi là phân loại văn bản, là một tác vụ xử lý ngôn ngữ tự nhiên có giám sát, tự động gán các tài liệu vào các danh mục định trước. Dựa trên phương pháp máy học hỗ trợ vector (support vector machine) cho phân loại văn bản được thiết lập bởi Joachims (1998) và củng cố trong tài liệu khai phá văn bản bởi Aggarwal và Zhai (2012), nó hỗ trợ các tác vụ như phát hiện thư rác và phân loại chủ đề bằng cách học từ các ví dụ đã gán nhãn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Phân loại văn bản

Phân cụm tài liệu Trích xuất từ khóa Phân tích Cảm xúc TF-IDF Khai thác lập luận Phân tích tình cảm dựa t…Phân loại tác giả (Phong…Chấm điểm bài luận tự độ…Đánh giá văn bản tự động Khai phá dữ liệu văn bản…

+45 more

Nguồn tài liệu

Joachims, T. (1998). Text Categorization with Support Vector Machines: Learning with Many Relevant Features. ECML 1998. Lecture Notes in Computer Science, vol 1398. Springer. DOI: 10.1007/BFb0026683 ↗
Aggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 978-1-4614-3222-7

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Text Classification (Text Categorization). ScholarGate. https://scholargate.app/vi/text-mining/text-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Phân cụm tài liệuKhai phá văn bản↔ compare
Trích xuất từ khóaKhai phá văn bản↔ compare
Phân tích Cảm xúcKhai phá văn bản↔ compare
TF-IDFKhai phá văn bản↔ compare

Compare side by side →

Được tham chiếu bởi

Khai thác lập luận Phân tích tình cảm dựa trên khía cạnh (Aspect-Based Sentiment Analysis - ABSA)Phân loại tác giả (Phong cách học)Chấm điểm bài luận tự động (AES)Đánh giá văn bản tự động Khai phá dữ liệu văn bản lâm sàng Phân tích nội dung Học tương phản cho NLP Phân tích văn bản đa ngôn ngữ Phân loại hành vi hội thoại Phân tích diễn ngôn Doc2Vec Thích nghi miền Phát hiện cảm xúc trong văn bản Phát hiện sự kiện Mô hình chủ đề LDA có khả năng giải thích Phát hiện tin giả Phân loại văn bản với số lượng ví dụ ít (Few-Shot Text Classification)Phát hiện thiên vị giới trong NLP Phát hiện ảo giác Phát hiện ngôn từ kích động thù địch Phân tích cảm xúc ngầm – Phát hiện ý kiến phụ thuộc ngữ cảnh Phát hiện ý định Nhận dạng ngôn ngữ (LID)Đánh giá tính chấp nhận ngôn ngữ Đọc hiểu máy (MRC)Tóm tắt đa văn bản Mô hình ngôn ngữ N-gram Nhận dạng thực thể có tên (NER)Khai thác ý kiến Phát hiện Tương đương Ngữ nghĩa Kỹ thuậtPrompt Phát hiện Tuyên truyền Question Answering (QA)Phân tích khả năng đọc Trích xuất quan hệ Phân tích tình cảm tự giám sát Phân tích ngữ nghĩa – Từ ngôn ngữ tự nhiên đến biểu diễn hình thức Phân tích Cảm xúc Điền vào ô trống Xử lý ngôn ngữ tự nhiên trên mạng xã hội Phát hiện suy đoán Phát hiện Quan điểm Phát hiện tính chủ quan Tính điểm mạch lạc văn bản Khử trùng văn bản Điền văn bản Hồi quy văn bản Suy luận văn bản TF-IDF Trích xuất Dòng thời gian Word2Vec Phân loại không cần huấn luyện (Zero-Shot Classification)

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi