การถดถอยเชิงเส้นอย่างง่าย
การถดถอยเชิงเส้นอย่างง่ายจำลองค่าที่คาดหวังของผลลัพธ์ต่อเนื่องในรูปของฟังก์ชันเส้นตรงของตัวแปรอธิบายตัวเดียว โดยประมาณค่าจุดตัดแกนและค่าความชันด้วยวิธีกำลังสองน้อยที่สุด ซึ่งค่าความชันจะแสดงให้เห็นว่าผลลัพธ์เปลี่ยนแปลงไปเท่าใดโดยเฉลี่ย สำหรับการเพิ่มขึ้นหนึ่งหน่วยของตัวทำนาย ถือเป็นแบบจำลองการถดถอยพื้นฐานที่ใช้สร้างแบบจำลองที่ซับซ้อนยิ่งขึ้น
Definition
การถดถอยเชิงเส้นอย่างง่ายจะปรับแบบจำลอง E(Y) = a + bX โดยประมาณค่าจุดตัดแกน a และความชัน b ด้วยการลดผลรวมกำลังสองของค่าคลาดเคลื่อน (residuals) ให้เหลือน้อยที่สุด (วิธีกำลังสองน้อยที่สุดสามัญ) เพื่อให้ความชันสามารถระบุการเปลี่ยนแปลงโดยเฉลี่ยของผลลัพธ์ต่อเนื่อง Y ต่อการเพิ่มขึ้นหนึ่งหน่วยของตัวทำนาย X เพียงตัวเดียว
Scope
บทความนี้ครอบคลุมแบบจำลองเส้นตรงที่มีตัวทำนายหนึ่งตัว: ความหมายของจุดตัดแกนและความชัน, การประมาณค่าด้วยวิธีกำลังสองน้อยที่สุด, ข้อสมมติฐานของความเป็นเชิงเส้น, ความเป็นอิสระ, ความแปรปรวนคงที่, และค่าคลาดเคลื่อน (residuals) ที่มีการแจกแจงปกติโดยประมาณ, และการตีความความเหมาะสมของแบบจำลองผ่านช่วงความเชื่อมั่น, การทำนาย, และสัมประสิทธิ์การตัดสินใจ นี่เป็นหัวข้อทางระเบียบวิธีวิจัย ไม่ใช่แนวทางปฏิบัติทางคลินิก
Core questions
- จะปรับเส้นตรงให้เข้ากับข้อมูลได้อย่างไร และ 'กำลังสองน้อยที่สุด' ลดอะไรให้เหลือน้อยที่สุด?
- จุดตัดแกนและความชันมีความหมายในเชิงเนื้อหาอย่างไร?
- ข้อสมมติฐานใดบ้างที่ต้องเป็นจริงเพื่อให้ค่าประมาณและช่วงความเชื่อมั่นมีความถูกต้อง?
- การถดถอยเชิงเส้นอย่างง่ายเกี่ยวข้องกับสัมประสิทธิ์สหสัมพันธ์อย่างไร?
- เส้นที่ปรับพอดีใช้สำหรับการประมาณค่ากับการทำนายแตกต่างกันอย่างไร?
Key concepts
- จุดตัดแกนและความชัน
- วิธีกำลังสองน้อยที่สุดสามัญ
- ค่าคลาดเคลื่อน (Residuals)
- ข้อสมมติฐาน: ความเป็นเชิงเส้น, ความเป็นอิสระ, ความแปรปรวนคงที่, ความคลาดเคลื่อนปกติ
- ช่วงความเชื่อมั่นสำหรับความชัน
- สัมประสิทธิ์การตัดสินใจ (R-squared)
- ช่วงความเชื่อมั่นเทียบกับช่วงการทำนาย
- การถดถอยสู่ค่าเฉลี่ย
Mechanisms
แบบจำลองนี้ตั้งสมมติฐานว่าค่าเฉลี่ยของผลลัพธ์อยู่บนเส้นตรงในตัวทำนาย โดยมีการกระจายของข้อมูลแต่ละจุดรอบเส้นนั้น วิธีกำลังสองน้อยที่สุดสามัญจะเลือกจุดตัดแกนและความชันที่ทำให้ผลรวมกำลังสองของระยะทางแนวตั้ง (ค่าคลาดเคลื่อน) ระหว่างค่าที่สังเกตได้กับค่าที่ปรับพอดีมีค่าน้อยที่สุด ค่าประมาณความชันมีค่าความคลาดเคลื่อนมาตรฐาน ซึ่งสามารถนำไปสร้างช่วงความเชื่อมั่นและการทดสอบสมมติฐานได้ โดยจะใช้ได้เมื่อค่าคลาดเคลื่อนเป็นอิสระ มีความแปรปรวนคงที่โดยประมาณ และมีการแจกแจงปกติโดยประมาณ สัมประสิทธิ์การตัดสินใจ (R-squared) รายงานสัดส่วนของความแปรปรวนของผลลัพธ์ที่อธิบายได้ด้วยตัวทำนาย และเท่ากับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันในกรณีที่มีตัวทำนายเดียว ช่วงความเชื่อมั่นอธิบายความไม่แน่นอนของค่าเฉลี่ยผลลัพธ์ที่ค่าตัวทำนายที่กำหนด ในขณะที่ช่วงการทำนายซึ่งกว้างกว่า จะอธิบายความไม่แน่นอนของการสังเกตการณ์ในอนาคตแต่ละรายการ
Clinical relevance
การถดถอยเชิงเส้นอย่างง่ายปรากฏให้เห็นทั่วไปในวรรณกรรมด้านสุขภาพ เพื่ออธิบายว่าการวัดค่าต่อเนื่องหนึ่งค่ามีความสัมพันธ์กับการวัดค่าต่อเนื่องอีกค่าหนึ่งอย่างไร และเพื่อสร้างความสัมพันธ์อ้างอิงและเส้นสอบเทียบ การตระหนักถึงข้อสมมติฐานของแบบจำลองเป็นส่วนหนึ่งของการประเมินการวิเคราะห์ดังกล่าว บทความนี้อธิบายวิธีการและไม่ใช่พื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาเฉพาะบุคคล
Evidence & guidelines
ตำราสถิติทางการแพทย์มาตรฐานและชุดบทความ BMJ Statistics Notes อธิบายวิธีการรายงานและตีความเส้นถดถอย ความชัน และช่วงความเชื่อมั่นของเส้นถดถอย และเน้นย้ำถึงการตรวจสอบค่าคลาดเคลื่อนก่อนที่จะเชื่อถือเส้นที่ปรับพอดี
History
แบบจำลองเส้นตรงมีที่มาจากข้อสังเกตของฟรานซิส กาลตันในศตวรรษที่ 19 เรื่อง 'การถดถอยสู่ค่าเฉลี่ย' ในลักษณะทางพันธุกรรม ซึ่งเป็นปรากฏการณ์ที่ทำให้การถดถอยมีชื่อนี้ และมาจากวิธีกำลังสองน้อยที่สุดที่พัฒนาขึ้นก่อนหน้านี้ในสาขาดาราศาสตร์และธรณีวิทยา เพียร์สันและผู้สืบทอดได้กำหนดรูปแบบการอนุมานสำหรับความชัน และแบบจำลองนี้ได้กลายเป็นจุดเริ่มต้นสำหรับกลไกการถดถอยที่กว้างขึ้นของชีวสถิติสมัยใหม่
Key figures
- Francis Galton
- Karl Pearson
- Douglas Altman
- Martin Bland
Related topics
Seminal works
- altman-1991
- kutner-2005
Frequently asked questions
- ความชันในการถดถอยเชิงเส้นอย่างง่ายหมายความว่าอย่างไร?
- ความชันคือการเปลี่ยนแปลงโดยเฉลี่ยของผลลัพธ์สำหรับการเพิ่มขึ้นหนึ่งหน่วยของตัวทำนาย ช่วงความเชื่อมั่นและค่า p-value ของความชันบ่งชี้ว่ามีการประมาณค่าได้อย่างแม่นยำเพียงใด และความสัมพันธ์นั้นสามารถแยกแยะได้จากการไม่มีความสัมพันธ์หรือไม่
- ความแตกต่างระหว่างช่วงความเชื่อมั่นและช่วงการทำนายสำหรับเส้นถดถอยคืออะไร?
- ช่วงความเชื่อมั่นแสดงถึงความไม่แน่นอนเกี่ยวกับค่าเฉลี่ยของผลลัพธ์ที่ค่าตัวทำนายที่กำหนด ในขณะที่ช่วงการทำนายซึ่งกว้างกว่า จะแสดงถึงความไม่แน่นอนเกี่ยวกับการสังเกตการณ์ใหม่แต่ละรายการที่ค่านั้น เนื่องจากช่วงการทำนายยังรวมถึงการกระจายของจุดรอบเส้นด้วย