ScholarGate
ผู้ช่วย

การจับคู่และการแบ่งชั้นในการศึกษา

การจับคู่ (matching) และการแบ่งชั้น (stratification) เป็นกลวิธีในการออกแบบการศึกษาที่ใช้เพื่อควบคุมตัวแปรกวน (confounding) โดยสร้างความสมดุลสำหรับปัจจัยที่ทราบตั้งแต่เริ่มต้นการศึกษา การจับคู่จะจับคู่หรือจัดกลุ่มตัวอย่างเพื่อให้กลุ่มเปรียบเทียบมีการกระจายตัวของตัวแปรกวนที่เหมือนกัน ในขณะที่การแบ่งชั้นจะแบ่งตัวอย่างออกเป็นชั้นย่อยที่เป็นเนื้อเดียวกัน (homogeneous strata) ซึ่งจะทำการเปรียบเทียบภายในชั้นนั้นๆ ทั้งสองวิธีนี้เป็นวิธีการทำให้กลุ่มเปรียบเทียบมีความคล้ายคลึงกันมากขึ้นในตัวแปรที่เลือก เพื่อให้ความแตกต่างที่สนใจไม่ถูกบิดเบือนโดยตัวแปรเหล่านั้น

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

การจับคู่ (matching) เป็นเทคนิคการออกแบบที่เลือกกลุ่มตัวอย่างเปรียบเทียบเพื่อให้มีการกระจายตัวของตัวแปรกวนหนึ่งตัวหรือมากกว่านั้นเหมือนกับกลุ่มตัวอย่างดัชนี (index subjects) และการแบ่งชั้น (stratification) คือการแบ่งกลุ่มตัวอย่างออกเป็นกลุ่มย่อย (strata) ที่กำหนดโดยตัวแปรกวน เพื่อให้การเปรียบเทียบระหว่างการสัมผัสและผลลัพธ์ (exposure-outcome comparisons) ทำขึ้นภายในกลุ่มย่อยที่เป็นเนื้อเดียวกัน

Scope

บทความนี้ครอบคลุมเหตุผลเบื้องหลังการจับคู่และการแบ่งชั้น ความแตกต่างระหว่างการจับคู่รายบุคคล (individual matching) และการจับคู่ความถี่ (frequency matching) การใช้ชั้นย่อยทั้งในการศึกษาเชิงสังเกต (observational studies) และการทดลองแบบสุ่ม (randomized trials) และผลกระทบเชิงวิเคราะห์ (เช่น ความจำเป็นในการวิเคราะห์แบบจับคู่หรือแบบแบ่งชั้น) บทความนี้จัดทำขึ้นเพื่อเป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัยเกี่ยวกับการควบคุมตัวแปรกวนโดยการออกแบบ และไม่ได้ให้คำแนะนำทางคลินิก

Key concepts

  • การควบคุมตัวแปรกวนโดยการออกแบบ
  • การจับคู่รายบุคคล (คู่) เทียบกับการจับคู่ความถี่
  • ชั้นย่อยและการเปรียบเทียบภายในชั้นย่อย
  • การสุ่มแบบแบ่งชั้นในการทดลอง
  • การวิเคราะห์แบบจับคู่ (วิธีการแบบมีเงื่อนไข)
  • การจับคู่มากเกินไป (Overmatching)
  • การสูญเสียประสิทธิภาพจากการจับคู่ในตัวแปรที่ไม่ใช่ตัวแปรกวน

Mechanisms

ทั้งสองเทคนิคนี้ช่วยขจัดหรือลดตัวแปรกวนโดยตัวแปรที่เลือกก่อนการวิเคราะห์ การจับคู่จะบังคับให้ปัจจัยที่ถูกจับคู่มีการกระจายตัวที่เหมือนกันในกลุ่มที่กำลังเปรียบเทียบ ดังนั้นจึงไม่สามารถเป็นตัวแปรกวนความสัมพันธ์ได้อีกต่อไป แต่ต้องใช้การวิเคราะห์ที่เคารพโครงสร้างการจับคู่ การวิเคราะห์ข้อมูลที่จับคู่ราวกับว่าไม่ได้จับคู่อาจทำให้ผลลัพธ์เกิดอคติได้ การแบ่งชั้นจะแบ่งกลุ่มตัวอย่างออกเป็นชั้นย่อยซึ่งตัวแปรกวนจะคงที่โดยพื้นฐาน ประเมินความสัมพันธ์ภายในแต่ละชั้นย่อย และรวมการประมาณค่าเฉพาะชั้นย่อย ในการทดลองแบบสุ่ม การสุ่มแบบแบ่งชั้น (stratified randomization) จะทำการจัดสรรแยกกันภายในชั้นย่อยเพื่อรักษาสมดุลของปัจจัยพยากรณ์ที่สำคัญในกลุ่มต่างๆ โดยปกติจะใช้ร่วมกับการบล็อก (blocking)

Clinical relevance

การตระหนักว่าการศึกษาควบคุมตัวแปรกวนด้วยการจับคู่หรือการแบ่งชั้นหรือไม่ และได้วิเคราะห์ข้อมูลตามนั้นหรือไม่ เป็นส่วนหนึ่งของการประเมินว่าความสัมพันธ์ที่สังเกตได้นั้นน่าเชื่อถือเพียงใด บทความนี้อธิบายระเบียบวิธีวิจัยสำหรับการออกแบบและการวิเคราะห์ และไม่ใช่แหล่งข้อมูลสำหรับการวินิจฉัยหรือแนวทางการรักษา

Evidence & guidelines

วรรณกรรมทางระเบียบวิธีวิจัยแยกแยะการกระทำของการจับคู่ในการออกแบบจากการกระทำของการวิเคราะห์แบบแบ่งชั้นหรือแบบจับคู่ และเน้นย้ำว่าการออกแบบแบบจับคู่จำเป็นต้องมีการวิเคราะห์แบบจับคู่เพื่อหลีกเลี่ยงอคติ คำแนะนำเกี่ยวกับการสุ่มแบบแบ่งชั้นในการทดลองระบุว่ามีประโยชน์มากที่สุดในการศึกษาขนาดเล็กและควรใช้ร่วมกับการบล็อก และตำราระบาดวิทยามาตรฐานได้ระบุว่าเมื่อใดที่การจับคู่ช่วยเพิ่มประสิทธิภาพ และเมื่อใดที่การจับคู่มากเกินไป (overmatching) ในตัวแปรที่ไม่ใช่ตัวแปรกวนจะส่งผลเสีย

History

การจับคู่ถูกนำมาใช้เป็นเวลานานในการศึกษาแบบควบคุมกรณี (case-control studies) ของโรคเรื้อรังเพื่อควบคุมตัวแปรกวนที่แข็งแกร่ง เช่น อายุและเพศ และเอกสารวิชาการของ Breslow และ Day ในปี 1980 ได้ประมวลผลการวิเคราะห์แบบมีเงื่อนไข (conditional (matched) analysis) ที่การออกแบบเหล่านี้ต้องการ การวิเคราะห์แบบแบ่งชั้นมีรากฐานมาจากวิธีการ Mantel-Haenszel ในช่วงกลางศตวรรษที่ 20 และการสุ่มแบบแบ่งชั้นถูกนำมาใช้ในการทดลองทางคลินิกเพื่อรักษาสมดุลของปัจจัยพยากรณ์ในกลุ่มการรักษาต่างๆ โดยมีการทบทวนระเบียบวิธีวิจัยในภายหลังที่ชี้แจงว่าเมื่อใดที่วิธีการนี้เพิ่มคุณค่า

Debates

เมื่อใดที่การจับคู่ช่วยได้ และเมื่อใดที่ส่งผลเสีย?
การจับคู่ในตัวแปรกวนที่แท้จริงสามารถเพิ่มประสิทธิภาพได้ แต่การจับคู่ในตัวแปรที่ไม่ใช่ตัวแปรกวน หรืออยู่ในเส้นทางเชิงสาเหตุ สามารถลดประสิทธิภาพหรือนำไปสู่อคติได้ (การจับคู่มากเกินไป) การตัดสินใจขึ้นอยู่กับโครงสร้างเชิงสาเหตุ ไม่ใช่ความสะดวก
การสุ่มแบบแบ่งชั้นจำเป็นหรือไม่ในการทดลองขนาดใหญ่?
การแบ่งชั้นช่วยรักษาสมดุลของปัจจัยพยากรณ์ที่สำคัญและมีคุณค่ามากที่สุดในการทดลองขนาดเล็ก ในขณะที่ในการทดลองขนาดใหญ่ การสุ่มแบบธรรมดามักจะรักษาสมดุลของปัจจัยต่างๆ ได้เอง การแบ่งชั้นมากเกินไปอาจสร้างชั้นย่อยที่กระจัดกระจายจำนวนมากและทำให้การออกแบบซับซ้อนขึ้น

Key figures

  • Norman Breslow
  • Nicholas Day
  • Kenneth Rothman
  • Sander Greenland
  • Neil Pearce

Related topics

Seminal works

  • breslow-day-1980-matching
  • pearce-2016-matched
  • kernan-1999-stratified

Frequently asked questions

ความแตกต่างระหว่างการจับคู่และการแบ่งชั้นคืออะไร?
การจับคู่เป็นการตัดสินใจในการสุ่มตัวอย่างที่ทำขึ้นเมื่อมีการเลือกกลุ่มตัวอย่าง (การเลือกกลุ่มตัวอย่างเปรียบเทียบเพื่อให้มีการกระจายตัวของตัวแปรกวนที่เหมือนกัน) ในขณะที่การแบ่งชั้นจะแบ่งกลุ่มตัวอย่างออกเป็นกลุ่มย่อยที่กำหนดโดยตัวแปรกวน และเปรียบเทียบการสัมผัสและผลลัพธ์ภายในกลุ่มย่อยเหล่านั้น ข้อมูลที่จับคู่ยังต้องมีการวิเคราะห์แบบจับคู่ด้วย
การจับคู่มากเกินไป (overmatching) คืออะไร?
การจับคู่มากเกินไปคือการจับคู่ในตัวแปรที่ไม่ควรจับคู่ เช่น ตัวแปรที่ไม่ใช่ตัวแปรกวน หรือตัวแปรที่อยู่ในเส้นทางเชิงสาเหตุระหว่างการสัมผัสและผลลัพธ์ ซึ่งสามารถลดประสิทธิภาพทางสถิติหรือทำให้เกิดอคติในการประมาณค่า แทนที่จะช่วยควบคุมตัวแปรกวน

Methods for this concept

Related concepts