Process / pipeline

Khai thác văn bản khoa học — Xử lý ngôn ngữ tự nhiên học thuật

Khai thác văn bản khoa học là một quy trình xử lý ngôn ngữ tự nhiên (NLP) được áp dụng cho tài liệu học thuật. Dựa trên các mô hình được huấn luyện trước theo lĩnh vực cụ thể như SciBERT (Beltagy và cộng sự, 2019) và SPECTER (Cohan và cộng sự, 2020), nó tự động trích xuất các giả thuyết, phương pháp luận, kết quả và đóng góp học thuật từ các bài báo toàn văn hoặc tóm tắt, cho phép tự động hóa đánh giá có hệ thống, phân tích xu hướng nghiên cứu và lập bản đồ khoa học ở quy mô lớn.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Beltagy, I., Lo, K., & Cohan, A. (2019). SciBERT: A Pretrained Language Model for Scientific Text. EMNLP 2019. link
  2. Cohan, A., Feldman, S., Beltagy, I., Downey, D., & Weld, D. (2020). SPECTER: Document-Level Representation Learning using Citation-Informed Transformers. ACL 2020. link

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Scientific Text Mining (Scholarly NLP). ScholarGate. https://scholargate.app/vi/text-mining/scientific-text-mining

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateScientific Text Mining (Scientific Text Mining (Scholarly NLP)). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/text-mining/scientific-text-mining · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026