Process / pipeline

การถดถอยจากข้อความ — การทำนายตัวเลขจากข้อความ

การถดถอยจากข้อความ (Text regression) เป็นการทำนายตัวแปรตามที่เป็นค่าต่อเนื่องโดยใช้คุณลักษณะที่สกัดจากข้อความ เช่น ค่า TF-IDF, การฝังคำ (embeddings) หรือ n-grams เป็นตัวแปรอิสระ โดยต่อยอดจากแนวคิด text-as-data ที่ Gentzkow, Kelly และ Taddy (2019) ได้รวบรวมไว้ วิธีนี้ช่วยให้สามารถประมาณค่าผลลัพธ์ที่เป็นตัวเลข เช่น ราคา, คะแนนความพึงพอใจ หรือคะแนนความรู้สึกได้โดยตรงจากเอกสาร และมีการใช้งานอย่างแพร่หลายในการวิจัยทางสังคมศาสตร์ เศรษฐศาสตร์ และการเงิน

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020
  2. Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/th/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ถูกอ้างอิงโดย

ScholarGateText Regression (Text-Based Regression). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/text-mining/text-regression · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026