การจับคู่และการแบ่งชั้นในการศึกษา
การจับคู่ (matching) และการแบ่งชั้น (stratification) เป็นกลวิธีในการออกแบบการศึกษาที่ใช้เพื่อควบคุมตัวแปรกวน (confounding) โดยสร้างความสมดุลสำหรับปัจจัยที่ทราบตั้งแต่เริ่มต้นการศึกษา การจับคู่จะจับคู่หรือจัดกลุ่มตัวอย่างเพื่อให้กลุ่มเปรียบเทียบมีการกระจายตัวของตัวแปรกวนที่เหมือนกัน ในขณะที่การแบ่งชั้นจะแบ่งตัวอย่างออกเป็นชั้นย่อยที่เป็นเนื้อเดียวกัน (homogeneous strata) ซึ่งจะทำการเปรียบเทียบภายในชั้นนั้นๆ ทั้งสองวิธีนี้เป็นวิธีการทำให้กลุ่มเปรียบเทียบมีความคล้ายคลึงกันมากขึ้นในตัวแปรที่เลือก เพื่อให้ความแตกต่างที่สนใจไม่ถูกบิดเบือนโดยตัวแปรเหล่านั้น
Definition
การจับคู่ (matching) เป็นเทคนิคการออกแบบที่เลือกกลุ่มตัวอย่างเปรียบเทียบเพื่อให้มีการกระจายตัวของตัวแปรกวนหนึ่งตัวหรือมากกว่านั้นเหมือนกับกลุ่มตัวอย่างดัชนี (index subjects) และการแบ่งชั้น (stratification) คือการแบ่งกลุ่มตัวอย่างออกเป็นกลุ่มย่อย (strata) ที่กำหนดโดยตัวแปรกวน เพื่อให้การเปรียบเทียบระหว่างการสัมผัสและผลลัพธ์ (exposure-outcome comparisons) ทำขึ้นภายในกลุ่มย่อยที่เป็นเนื้อเดียวกัน
Scope
บทความนี้ครอบคลุมเหตุผลเบื้องหลังการจับคู่และการแบ่งชั้น ความแตกต่างระหว่างการจับคู่รายบุคคล (individual matching) และการจับคู่ความถี่ (frequency matching) การใช้ชั้นย่อยทั้งในการศึกษาเชิงสังเกต (observational studies) และการทดลองแบบสุ่ม (randomized trials) และผลกระทบเชิงวิเคราะห์ (เช่น ความจำเป็นในการวิเคราะห์แบบจับคู่หรือแบบแบ่งชั้น) บทความนี้จัดทำขึ้นเพื่อเป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัยเกี่ยวกับการควบคุมตัวแปรกวนโดยการออกแบบ และไม่ได้ให้คำแนะนำทางคลินิก
Key concepts
- การควบคุมตัวแปรกวนโดยการออกแบบ
- การจับคู่รายบุคคล (คู่) เทียบกับการจับคู่ความถี่
- ชั้นย่อยและการเปรียบเทียบภายในชั้นย่อย
- การสุ่มแบบแบ่งชั้นในการทดลอง
- การวิเคราะห์แบบจับคู่ (วิธีการแบบมีเงื่อนไข)
- การจับคู่มากเกินไป (Overmatching)
- การสูญเสียประสิทธิภาพจากการจับคู่ในตัวแปรที่ไม่ใช่ตัวแปรกวน
Mechanisms
ทั้งสองเทคนิคนี้ช่วยขจัดหรือลดตัวแปรกวนโดยตัวแปรที่เลือกก่อนการวิเคราะห์ การจับคู่จะบังคับให้ปัจจัยที่ถูกจับคู่มีการกระจายตัวที่เหมือนกันในกลุ่มที่กำลังเปรียบเทียบ ดังนั้นจึงไม่สามารถเป็นตัวแปรกวนความสัมพันธ์ได้อีกต่อไป แต่ต้องใช้การวิเคราะห์ที่เคารพโครงสร้างการจับคู่ การวิเคราะห์ข้อมูลที่จับคู่ราวกับว่าไม่ได้จับคู่อาจทำให้ผลลัพธ์เกิดอคติได้ การแบ่งชั้นจะแบ่งกลุ่มตัวอย่างออกเป็นชั้นย่อยซึ่งตัวแปรกวนจะคงที่โดยพื้นฐาน ประเมินความสัมพันธ์ภายในแต่ละชั้นย่อย และรวมการประมาณค่าเฉพาะชั้นย่อย ในการทดลองแบบสุ่ม การสุ่มแบบแบ่งชั้น (stratified randomization) จะทำการจัดสรรแยกกันภายในชั้นย่อยเพื่อรักษาสมดุลของปัจจัยพยากรณ์ที่สำคัญในกลุ่มต่างๆ โดยปกติจะใช้ร่วมกับการบล็อก (blocking)
Clinical relevance
การตระหนักว่าการศึกษาควบคุมตัวแปรกวนด้วยการจับคู่หรือการแบ่งชั้นหรือไม่ และได้วิเคราะห์ข้อมูลตามนั้นหรือไม่ เป็นส่วนหนึ่งของการประเมินว่าความสัมพันธ์ที่สังเกตได้นั้นน่าเชื่อถือเพียงใด บทความนี้อธิบายระเบียบวิธีวิจัยสำหรับการออกแบบและการวิเคราะห์ และไม่ใช่แหล่งข้อมูลสำหรับการวินิจฉัยหรือแนวทางการรักษา
Evidence & guidelines
วรรณกรรมทางระเบียบวิธีวิจัยแยกแยะการกระทำของการจับคู่ในการออกแบบจากการกระทำของการวิเคราะห์แบบแบ่งชั้นหรือแบบจับคู่ และเน้นย้ำว่าการออกแบบแบบจับคู่จำเป็นต้องมีการวิเคราะห์แบบจับคู่เพื่อหลีกเลี่ยงอคติ คำแนะนำเกี่ยวกับการสุ่มแบบแบ่งชั้นในการทดลองระบุว่ามีประโยชน์มากที่สุดในการศึกษาขนาดเล็กและควรใช้ร่วมกับการบล็อก และตำราระบาดวิทยามาตรฐานได้ระบุว่าเมื่อใดที่การจับคู่ช่วยเพิ่มประสิทธิภาพ และเมื่อใดที่การจับคู่มากเกินไป (overmatching) ในตัวแปรที่ไม่ใช่ตัวแปรกวนจะส่งผลเสีย
History
การจับคู่ถูกนำมาใช้เป็นเวลานานในการศึกษาแบบควบคุมกรณี (case-control studies) ของโรคเรื้อรังเพื่อควบคุมตัวแปรกวนที่แข็งแกร่ง เช่น อายุและเพศ และเอกสารวิชาการของ Breslow และ Day ในปี 1980 ได้ประมวลผลการวิเคราะห์แบบมีเงื่อนไข (conditional (matched) analysis) ที่การออกแบบเหล่านี้ต้องการ การวิเคราะห์แบบแบ่งชั้นมีรากฐานมาจากวิธีการ Mantel-Haenszel ในช่วงกลางศตวรรษที่ 20 และการสุ่มแบบแบ่งชั้นถูกนำมาใช้ในการทดลองทางคลินิกเพื่อรักษาสมดุลของปัจจัยพยากรณ์ในกลุ่มการรักษาต่างๆ โดยมีการทบทวนระเบียบวิธีวิจัยในภายหลังที่ชี้แจงว่าเมื่อใดที่วิธีการนี้เพิ่มคุณค่า
Debates
- เมื่อใดที่การจับคู่ช่วยได้ และเมื่อใดที่ส่งผลเสีย?
- การจับคู่ในตัวแปรกวนที่แท้จริงสามารถเพิ่มประสิทธิภาพได้ แต่การจับคู่ในตัวแปรที่ไม่ใช่ตัวแปรกวน หรืออยู่ในเส้นทางเชิงสาเหตุ สามารถลดประสิทธิภาพหรือนำไปสู่อคติได้ (การจับคู่มากเกินไป) การตัดสินใจขึ้นอยู่กับโครงสร้างเชิงสาเหตุ ไม่ใช่ความสะดวก
- การสุ่มแบบแบ่งชั้นจำเป็นหรือไม่ในการทดลองขนาดใหญ่?
- การแบ่งชั้นช่วยรักษาสมดุลของปัจจัยพยากรณ์ที่สำคัญและมีคุณค่ามากที่สุดในการทดลองขนาดเล็ก ในขณะที่ในการทดลองขนาดใหญ่ การสุ่มแบบธรรมดามักจะรักษาสมดุลของปัจจัยต่างๆ ได้เอง การแบ่งชั้นมากเกินไปอาจสร้างชั้นย่อยที่กระจัดกระจายจำนวนมากและทำให้การออกแบบซับซ้อนขึ้น
Key figures
- Norman Breslow
- Nicholas Day
- Kenneth Rothman
- Sander Greenland
- Neil Pearce
Related topics
Seminal works
- breslow-day-1980-matching
- pearce-2016-matched
- kernan-1999-stratified
Frequently asked questions
- ความแตกต่างระหว่างการจับคู่และการแบ่งชั้นคืออะไร?
- การจับคู่เป็นการตัดสินใจในการสุ่มตัวอย่างที่ทำขึ้นเมื่อมีการเลือกกลุ่มตัวอย่าง (การเลือกกลุ่มตัวอย่างเปรียบเทียบเพื่อให้มีการกระจายตัวของตัวแปรกวนที่เหมือนกัน) ในขณะที่การแบ่งชั้นจะแบ่งกลุ่มตัวอย่างออกเป็นกลุ่มย่อยที่กำหนดโดยตัวแปรกวน และเปรียบเทียบการสัมผัสและผลลัพธ์ภายในกลุ่มย่อยเหล่านั้น ข้อมูลที่จับคู่ยังต้องมีการวิเคราะห์แบบจับคู่ด้วย
- การจับคู่มากเกินไป (overmatching) คืออะไร?
- การจับคู่มากเกินไปคือการจับคู่ในตัวแปรที่ไม่ควรจับคู่ เช่น ตัวแปรที่ไม่ใช่ตัวแปรกวน หรือตัวแปรที่อยู่ในเส้นทางเชิงสาเหตุระหว่างการสัมผัสและผลลัพธ์ ซึ่งสามารถลดประสิทธิภาพทางสถิติหรือทำให้เกิดอคติในการประมาณค่า แทนที่จะช่วยควบคุมตัวแปรกวน