Phân tích từ ngữ cố định — Liên kết từ vựng
Phân tích từ ngữ cố định (collocation analysis) là một kỹ thuật khai phá dữ liệu văn bản thống kê nhằm xác định các cặp từ hoặc cụm từ thường xuyên xuất hiện cùng nhau, sử dụng các thước đo liên kết thay vì sự đồng xuất hiện ngẫu nhiên. Được giới thiệu trong công trình từ điển học của Church và Hanks (1990), kỹ thuật này được sử dụng để trích xuất thuật ngữ và phân tích ngôn ngữ, làm nổi bật các đơn vị đa từ mang ý nghĩa trong một tập hợp văn bản (corpus).
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Church, K.W. & Hanks, P. (1990). Word Association Norms, Mutual Information, and Lexicography. Computational Linguistics, 16(1), 22-29. link ↗
- Manning, C.D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Collocation Analysis (Word Association). ScholarGate. https://scholargate.app/vi/text-mining/collocation-analysis
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Phân tích phụ thuộcKhai phá văn bản↔ compare
- Độ đa dạng từ vựngKhai phá văn bản↔ compare
- Phân tích tần suất văn bảnKhai phá văn bản↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →