Process / pipeline

Khai thác văn bản khoa học — Xử lý ngôn ngữ tự nhiên học thuật

Khai thác văn bản khoa học là một quy trình xử lý ngôn ngữ tự nhiên (NLP) được áp dụng cho tài liệu học thuật. Dựa trên các mô hình được huấn luyện trước theo lĩnh vực cụ thể như SciBERT (Beltagy và cộng sự, 2019) và SPECTER (Cohan và cộng sự, 2020), nó tự động trích xuất các giả thuyết, phương pháp luận, kết quả và đóng góp học thuật từ các bài báo toàn văn hoặc tóm tắt, cho phép tự động hóa đánh giá có hệ thống, phân tích xu hướng nghiên cứu và lập bản đồ khoa học ở quy mô lớn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Khai thác văn bản khoa học

Phân tích thư mục Nhận dạng thực thể có tê…Phân tích Cảm xúc Topic Modeling (Mô hình…Khai phá dữ liệu văn bản…Liên kết thực thể

Nguồn tài liệu

Beltagy, I., Lo, K., & Cohan, A. (2019). SciBERT: A Pretrained Language Model for Scientific Text. EMNLP 2019. link ↗
Cohan, A., Feldman, S., Beltagy, I., Downey, D., & Weld, D. (2020). SPECTER: Document-Level Representation Learning using Citation-Informed Transformers. ACL 2020. link ↗