Trích xuất thông tin — Biến văn bản thành các bản ghi có cấu trúc
Trích xuất thông tin (IE) là một tác vụ xử lý ngôn ngữ tự nhiên nhằm chuyển đổi văn bản phi cấu trúc thành thông tin có cấu trúc — chẳng hạn như sự kiện, quan hệ và thuộc tính — để các sự kiện được chôn vùi trong các tài liệu dạng tự do trở thành các bản ghi có thể đọc được bởi máy. Tác vụ này được củng cố trong các bài tổng quan ban đầu của Cowie và Lehnert (1996) và sau đó là Grishman (2012).
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Nguồn tài liệu
- Cowie, J. & Lehnert, W. (1996). Information Extraction. Communications of the ACM. DOI: 10.1145/234173.234209 ↗
- Grishman, R. (2012). Information Extraction. In Handbook of Natural Language Processing. ISBN: 9781420085921
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Information Extraction (IE). ScholarGate. https://scholargate.app/vi/text-mining/information-extraction
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Nhận dạng thực thể có tên (NER)Khai phá văn bản↔ compare
- Trích xuất quan hệKhai phá văn bản↔ compare
- Độ tương đồng ngữ nghĩaKhai phá văn bản↔ compare
- Tóm tắt văn bảnKhai phá văn bản↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →