Process / pipeline

רגרסיית טקסט — חיזוי מספרים מטקסט

רגרסיה מבוססת טקסט חוזה משתנה מטרה רציף באמצעות מאפיינים המופקים מטקסט — ציוני TF-IDF, הטמעות (embeddings), או n-גרמות — כמשתנים בלתי תלויים. בהתבסס על תוכנית 'טקסט כנתונים' שאוחדה על ידי Gentzkow, Kelly ו-Taddy (2019), היא מאפשרת לאמוד תוצאה מספרית כגון מחיר, דירוג, או ציון סנטימנט ישירות ממסמכים, ונמצאת בשימוש נרחב ביישומי מדעי החברה, כלכלה ופיננסים.

פתיחה ב-MethodMindבקרובוידאובקרובDownload slides

קראו את השיטה במלואה

לחברים בלבד

התחברו עם חשבון חינמי כדי לקרוא חלק זה.

התחברות

Method map

The neighbourhood of related methods — select a node to explore.

רגרסיית טקסט

BERT Embeddings ניתוח סנטימנט סיווג טקסט TF-IDF מודל שפה מסוג N-gram

מקורות

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

איך לצטט עמוד זה

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/he/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT Embeddingsכריית טקסט↔ compare
ניתוח סנטימנטכריית טקסט↔ compare
סיווג טקסטכריית טקסט↔ compare
TF-IDFכריית טקסט↔ compare

Compare side by side →

מאוזכר על ידי

מודל שפה מסוג N-gram

מצאתם בעיה בעמוד זה? דווחו או הציעו תיקון →

קראו את השיטה במלואה

Method map

מקורות

איך לצטט עמוד זה

שיטות קשורות

Which method?

מאוזכר על ידי