Process / pipeline

การถดถอยจากข้อความ — การทำนายตัวเลขจากข้อความ

การถดถอยจากข้อความ (Text regression) เป็นการทำนายตัวแปรตามที่เป็นค่าต่อเนื่องโดยใช้คุณลักษณะที่สกัดจากข้อความ เช่น ค่า TF-IDF, การฝังคำ (embeddings) หรือ n-grams เป็นตัวแปรอิสระ โดยต่อยอดจากแนวคิด text-as-data ที่ Gentzkow, Kelly และ Taddy (2019) ได้รวบรวมไว้ วิธีนี้ช่วยให้สามารถประมาณค่าผลลัพธ์ที่เป็นตัวเลข เช่น ราคา, คะแนนความพึงพอใจ หรือคะแนนความรู้สึกได้โดยตรงจากเอกสาร และมีการใช้งานอย่างแพร่หลายในการวิจัยทางสังคมศาสตร์ เศรษฐศาสตร์ และการเงิน

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

การถดถอยจากข้อความ

BERT Embeddings การวิเคราะห์ความรู้สึก การจำแนกข้อความ TF-IDF แบบจำลองภาษาเอ็นแกรม

แหล่งอ้างอิง

Gentzkow, M., Kelly, B. & Taddy, M. (2019). Text as Data. Journal of Economic Literature, 57(3), 535-574. DOI: 10.1257/jel.20181020 ↗
Taddy, M. (2013). Measuring Political Sentiment on Twitter: Factor Optimal Design for Multinomial Inverse Regression. Technometrics, 55(4), 415-425. DOI: 10.1080/00401706.2013.778791 ↗

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 1). Text-Based Regression. ScholarGate. https://scholargate.app/th/text-mining/text-regression

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT Embeddingsการทำเหมืองข้อความ↔ compare
การวิเคราะห์ความรู้สึกการทำเหมืองข้อความ↔ compare
การจำแนกข้อความการทำเหมืองข้อความ↔ compare
TF-IDFการทำเหมืองข้อความ↔ compare

Compare side by side →

ถูกอ้างอิงโดย

แบบจำลองภาษาเอ็นแกรม

พบปัญหาในหน้านี้หรือไม่ แจ้งหรือเสนอการแก้ไข →