ความแปรปรวนร่วมและสหสัมพันธ์
ความแปรปรวนร่วม (covariance) วัดว่าตัวแปรสองตัวแปรเปลี่ยนแปลงไปพร้อมกันอย่างไร และสหสัมพันธ์ (correlation) จะปรับขนาดความแปรปรวนร่วมนั้นให้เป็นสัมประสิทธิ์ระหว่าง -1 ถึง +1 ซึ่งแสดงถึงความแรงและทิศทางของความสัมพันธ์เชิงเส้นโดยไม่ขึ้นอยู่กับหน่วยวัด สหสัมพันธ์เป็นหนึ่งในเครื่องมือแรกๆ ที่ใช้ในการอธิบายความสัมพันธ์ระหว่างปริมาณต่อเนื่องสองปริมาณในการวิจัยด้านสุขภาพ
Definition
ความแปรปรวนร่วมคือผลคูณเฉลี่ยของค่าเบี่ยงเบนของตัวแปรสองตัวจากค่าเฉลี่ยของมัน สหสัมพันธ์คือความแปรปรวนร่วมหารด้วยผลคูณของส่วนเบี่ยงเบนมาตรฐานทั้งสอง ซึ่งให้สัมประสิทธิ์ที่ไม่มีหน่วยระหว่าง -1 ถึง +1 ที่วัดความแรงและทิศทางของความสัมพันธ์เชิงเส้นของตัวแปรเหล่านั้น
Scope
บทความนี้ครอบคลุมถึงความแปรปรวนร่วมและรูปแบบมาตรฐานของมัน ได้แก่ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (Pearson product-moment correlation coefficient) สหสัมพันธ์แบบสเปียร์แมน (Spearman correlation) ที่อิงตามอันดับสำหรับความสัมพันธ์แบบทางเดียว (monotonic association) และข้อควรระวังทั่วไป: สหสัมพันธ์อธิบายความสัมพันธ์ไม่ใช่ความเป็นเหตุเป็นผล สะท้อนเฉพาะความสัมพันธ์เชิงเส้น (หรือแบบทางเดียว) เท่านั้น และแตกต่างจากการเห็นพ้องต้องกัน (agreement) นี่เป็นหัวข้อทางระเบียบวิธีวิจัย ไม่ใช่คำแนะนำทางคลินิก
Core questions
- ความแปรปรวนร่วมของตัวแปรสองตัวสรุปเป็นตัวเลขเดียวได้อย่างไร?
- สัมประสิทธิ์สหสัมพันธ์ที่มีขนาดที่กำหนดหมายความว่าอย่างไร และเครื่องหมายของมันบ่งชี้อะไร?
- เมื่อใดที่ควรใช้สัมประสิทธิ์แบบสเปียร์แมน (อิงตามอันดับ) แทนสัมประสิทธิ์แบบเพียร์สัน?
- เหตุใดสหสัมพันธ์จึงไม่หมายถึงความเป็นเหตุเป็นผล และเหตุใดจึงไม่เหมือนกับการเห็นพ้องต้องกัน?
Key concepts
- ความแปรปรวนร่วม
- สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน
- สหสัมพันธ์อันดับแบบสเปียร์แมน
- การทำให้เป็นมาตรฐานและการวัดที่ไม่มีหน่วย
- ความสัมพันธ์เชิงเส้นเทียบกับความสัมพันธ์แบบทางเดียว
- สหสัมพันธ์ไม่ใช่ความเป็นเหตุเป็นผล
- สหสัมพันธ์เทียบกับการเห็นพ้องต้องกัน
Mechanisms
ความแปรปรวนร่วมสะสมผลคูณของค่าเบี่ยงเบนคู่จากค่าเฉลี่ยของแต่ละตัวแปร โดยจะเป็นบวกเมื่อค่าสูงของตัวแปรหนึ่งมีแนวโน้มที่จะมาพร้อมกับค่าสูงของอีกตัวแปรหนึ่ง และจะเป็นลบเมื่อตัวแปรทั้งสองเคลื่อนที่ไปในทิศทางตรงกันข้าม แต่ขนาดของมันขึ้นอยู่กับหน่วย การหารด้วยส่วนเบี่ยงเบนมาตรฐานทั้งสองจะกำจัดหน่วยและจำกัดผลลัพธ์ให้อยู่ระหว่าง -1 ถึง +1 ซึ่งสร้างสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันที่จับความสัมพันธ์เชิงเส้นอย่างเคร่งครัด เมื่อความสัมพันธ์เป็นแบบทางเดียวแต่ไม่เป็นเชิงเส้น หรือข้อมูลเป็นแบบอันดับ (ordinal) หรือไม่เป็นแบบปกติ จะใช้สัมประสิทธิ์แบบสเปียร์แมน ซึ่งเป็นสัมประสิทธิ์แบบเพียร์สันที่ใช้กับอันดับแทน ค่าสหสัมพันธ์ที่ใกล้ศูนย์บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้น แต่ไม่ได้ตัดความเป็นไปได้ของความสัมพันธ์ที่ไม่เป็นเชิงเส้นออกไป
Clinical relevance
สัมประสิทธิ์สหสัมพันธ์มักถูกรายงานเป็นประจำเมื่อนักวิจัยอธิบายว่าการวัดทางคลินิกสองอย่างเคลื่อนที่ไปพร้อมกันอย่างไร ข้อควรระวังที่สำคัญในการประเมินคือ สหสัมพันธ์ที่สูงระหว่างวิธีการวัดสองวิธีไม่ได้หมายความว่าวิธีการเหล่านั้นเห็นพ้องต้องกัน เนื่องจากเครื่องมือสองชนิดอาจมีความสัมพันธ์กันอย่างมากแต่มีความแตกต่างอย่างเป็นระบบ การเห็นพ้องต้องกันจะถูกประเมินด้วยวิธีการอื่น เช่น การวิเคราะห์ขีดจำกัดของการเห็นพ้องต้องกัน (limits-of-agreement analysis) บทความนี้อธิบายถึงวิธีการและไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล
Evidence & guidelines
ตำราสถิติทางการแพทย์มาตรฐานและชุดบทความ Statistics Notes ใน BMJ ได้กำหนดวิธีการรายงานและตีความสหสัมพันธ์ รวมถึงความแตกต่างระหว่างสหสัมพันธ์และการเห็นพ้องต้องกัน ซึ่งเป็นแรงบันดาลใจให้เกิดแนวทาง Bland-Altman limits-of-agreement สำหรับการศึกษาเปรียบเทียบวิธีการ
History
สัมประสิทธิ์สหสัมพันธ์พัฒนามาจากการทำงานของ Francis Galton เกี่ยวกับพันธุกรรม และได้รับการกำหนดเป็นทางการโดย Karl Pearson ในช่วงปลายศตวรรษที่สิบเก้า Charles Spearman ได้นำเสนอสัมประสิทธิ์ที่อิงตามอันดับในปี 1904 สำหรับสถานการณ์ที่ลำดับของค่าเท่านั้นที่เชื่อถือได้ ในช่วงปลายศตวรรษที่ยี่สิบ Bland และ Altman ได้สร้างความแตกต่างที่ชัดเจนและมีอิทธิพลระหว่างสหสัมพันธ์และการเห็นพ้องต้องกัน ซึ่งเป็นการปรับเปลี่ยนวิธีการวิเคราะห์การศึกษาเปรียบเทียบวิธีการ
Debates
- สหสัมพันธ์ที่สูงแสดงให้เห็นว่าวิธีการวัดสองวิธีเห็นพ้องต้องกันหรือไม่?
- ไม่: สองวิธีอาจมีความสัมพันธ์กันสูงในขณะที่แตกต่างกันอย่างเป็นระบบ ดังนั้นสหสัมพันธ์จึงเป็นมาตรวัดที่ไม่เหมาะสมสำหรับการเห็นพ้องต้องกัน Bland และ Altman แย้งให้ใช้การวิเคราะห์ขีดจำกัดของการเห็นพ้องต้องกันแทน ซึ่งเป็นแนวทางมาตรฐานในการศึกษาเปรียบเทียบวิธีการในปัจจุบัน
Key figures
- Francis Galton
- Karl Pearson
- Charles Spearman
- Douglas Altman
- Martin Bland
Related topics
Seminal works
- spearman-1904
- bland-altman-1986
Frequently asked questions
- ความแตกต่างระหว่างความแปรปรวนร่วมและสหสัมพันธ์คืออะไร?
- ความแปรปรวนร่วมวัดว่าตัวแปรสองตัวแปรเปลี่ยนแปลงไปพร้อมกันอย่างไร แต่ขนาดของมันขึ้นอยู่กับหน่วย จึงยากที่จะตีความโดยตรง สหสัมพันธ์จะทำให้ความแปรปรวนร่วมเป็นมาตรฐานโดยใช้ส่วนเบี่ยงเบนมาตรฐานทั้งสอง ซึ่งให้สัมประสิทธิ์ที่ไม่มีหน่วยระหว่าง -1 ถึง +1 ที่สามารถเปรียบเทียบกันได้ระหว่างตัวแปรต่างๆ
- เมื่อใดที่ควรใช้สหสัมพันธ์แบบสเปียร์แมนแทนสหสัมพันธ์แบบเพียร์สัน?
- สหสัมพันธ์แบบสเปียร์แมน ซึ่งทำงานกับอันดับ จะถูกเลือกใช้เมื่อความสัมพันธ์เป็นแบบทางเดียวแต่ไม่เป็นเชิงเส้น เมื่อข้อมูลเป็นแบบอันดับ หรือเมื่อค่าผิดปกติ (outliers) หรือการแจกแจงที่ไม่เป็นปกติอาจบิดเบือนสัมประสิทธิ์แบบเพียร์สัน