Mở rộng từ viết tắt — Phân giải tên viết tắt và từ viết tắt
Phân giải tên viết tắt và từ viết tắt là một quy trình xử lý ngôn ngữ tự nhiên (NLP) ánh xạ mỗi dạng rút gọn trong một văn bản với định nghĩa đầy đủ của nó bằng cách sử dụng các gợi ý ngữ cảnh từ văn bản xung quanh. Điều này đặc biệt quan trọng trong các tài liệu y tế, pháp lý và kỹ thuật, nơi cùng một từ viết tắt có thể mang các ý nghĩa hoàn toàn khác nhau giữa các lĩnh vực. Thuật toán nền tảng của lĩnh vực này được Schwartz và Hearst (2003) công bố cho tài liệu y sinh và kể từ đó đã được mở rộng bởi các phương pháp dựa trên mạng nơ-ron và transformer.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Schwartz, A.S. & Hearst, M.A. (2003). A Simple Algorithm for Identifying Abbreviation Definitions in Biomedical Text. Pacific Symposium on Biocomputing (PSB), 8, 451-462. link ↗
- Veyseh, A.P.B. et al. (2022). MACRONYM: A Large-Scale Dataset for Macroeconomic Acronym Understanding. Findings of NAACL 2022. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 1). Abbreviation and Acronym Resolution. ScholarGate. https://scholargate.app/vi/text-mining/abbreviation-expansion
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Trích xuất thông tinKhai phá văn bản↔ compare
- Nhận dạng thực thể có tên (NER)Khai phá văn bản↔ compare
- Chuẩn hóa văn bảnKhai phá văn bản↔ compare
- Nhận dạng nghĩa của từ (Word Sense Disambiguation - WSD)Khai phá văn bản↔ compare
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →