Part-of-Speech Tagging
Part-of-speech (POS) tagging is the task of assigning each word (token) in a text its grammatical category — noun, verb, adjective, preposition, and finer distinctions such as past-tense verb or comparative adjective — drawn from a fixed tagset. Because the same word form can belong to different categories depending on context ("book a flight" versus "read a book"), tagging is fundamentally a disambiguation problem solved with contextual evidence. It is one of the oldest and most foundational tasks in natural language processing and corpus linguistics, supplying the grammatical layer on which concordancing, parsing, register analysis, and information extraction all depend. Modern taggers reach accuracies well above 97% on standard English benchmarks, using statistical sequence models or neural networks trained on annotated corpora.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Bản đồ phương pháp
Lân cận của các phương pháp liên quan — chọn một nút để khám phá.
Nguồn tài liệu
- Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to Information Retrieval. Cambridge University Press. ISBN: 9780521865715
- Jurafsky, D., & Martin, J. H. (2023). Speech and Language Processing (3rd ed. draft). Stanford University. link ↗
- Marcus, M. P., Marcinkiewicz, M. A., & Santorini, B. (1993). Building a large annotated corpus of English: The Penn Treebank. Computational Linguistics, 19(2), 313–330. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 22). Part-of-Speech Tagging in Corpus and Computational Linguistics. ScholarGate. https://scholargate.app/vi/linguistics/part-of-speech-tagging
Phương pháp nào?
Đặt phương pháp này bên cạnh những phương pháp gần gũi nhất với nó và đọc chúng song song — thư viện bày sách lên bàn; lựa chọn là của bạn.
- Phân tích từ ngữ cố địnhKhai phá văn bản↔ so sánh
- Corpus Concordance AnalysisNgôn ngữ học↔ so sánh
- Multidimensional Register AnalysisNgôn ngữ học↔ so sánh
- N-gram AnalysisNgôn ngữ học↔ so sánh
Được tham chiếu bởi
Phương pháp tương tự
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →