Process / pipeline

Phân tích từ ngữ cố định — Liên kết từ vựng

Phân tích từ ngữ cố định (collocation analysis) là một kỹ thuật khai phá dữ liệu văn bản thống kê nhằm xác định các cặp từ hoặc cụm từ thường xuyên xuất hiện cùng nhau, sử dụng các thước đo liên kết thay vì sự đồng xuất hiện ngẫu nhiên. Được giới thiệu trong công trình từ điển học của Church và Hanks (1990), kỹ thuật này được sử dụng để trích xuất thuật ngữ và phân tích ngôn ngữ, làm nổi bật các đơn vị đa từ mang ý nghĩa trong một tập hợp văn bản (corpus).

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Church, K.W. & Hanks, P. (1990). Word Association Norms, Mutual Information, and Lexicography. Computational Linguistics, 16(1), 22-29. link
  2. Manning, C.D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. MIT Press. ISBN: 9780262133609

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Collocation Analysis (Word Association). ScholarGate. https://scholargate.app/vi/text-mining/collocation-analysis

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateCollocation Analysis (Collocation Analysis (Word Association)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/text-mining/collocation-analysis · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026