Process / pipeline

כריה של טקסט מדעי — עיבוד שפה טבעית אקדמי

כריה של טקסט מדעי היא תהליך עיבוד שפה טבעית (NLP) המיושם על ספרות אקדמית. בהתבסס על מודלים מאומנים מראש בתחום הספציפי, כגון SciBERT (Beltagy et al., 2019) ו-SPECTER (Cohan et al., 2020), הוא מחלץ באופן אוטומטי השערות, מתודולוגיות, ממצאים ותרומות אקדמיות ממאמרים מלאים או תקצירים, ומאפשר אוטומציה של סקירות שיטתיות, ניתוח מגמות מחקר ומיפוי מדעי בקנה מידה גדול.

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

כריה של טקסט מדעי

ניתוח ביבליומטרי זיהוי ישויות מוכרות (NER)ניתוח סנטימנט מידול נושאים כריית טקסט קליני קישור ישויות

מקורות

Beltagy, I., Lo, K., & Cohan, A. (2019). SciBERT: A Pretrained Language Model for Scientific Text. EMNLP 2019. link ↗
Cohan, A., Feldman, S., Beltagy, I., Downey, D., & Weld, D. (2020). SPECTER: Document-Level Representation Learning using Citation-Informed Transformers. ACL 2020. link ↗