การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำ
การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำเป็นขั้นตอนมาตรฐานสองประการในการสอบถามว่าตัวแปรเชิงหมวดหมู่สองตัวในตารางความบังเอิญมีความสัมพันธ์กันหรือเป็นอิสระต่อกัน การทดสอบไคกำลังสองเปรียบเทียบจำนวนเซลล์ที่สังเกตได้กับจำนวนที่คาดการณ์ภายใต้ความเป็นอิสระโดยใช้การประมาณค่าตัวอย่างขนาดใหญ่ ในขณะที่การทดสอบฟิชเชอร์แบบแม่นยำจะคำนวณความน่าจะเป็นของตารางที่สังเกตได้โดยตรงและใช้เมื่อจำนวนข้อมูลมีน้อย
Definition
การทดสอบไคกำลังสองของความสัมพันธ์วัดความคลาดเคลื่อนระหว่างจำนวนเซลล์ที่สังเกตได้และที่คาดการณ์ภายใต้สมมติฐานว่างของความเป็นอิสระ โดยอ้างอิงสถิติที่ได้กับการแจกแจงไคกำลังสอง; ในทางกลับกัน การทดสอบฟิชเชอร์แบบแม่นยำจะคำนวณจาก การแจกแจงแบบไฮเปอร์จีออเมตริก โดยที่ขอบเขตถูกกำหนดไว้ ความน่าจะเป็นที่แน่นอนของตารางที่สังเกตได้และของทุกตารางที่รุนแรงกว่า
Scope
บทความนี้ครอบคลุมสถิติไคกำลังสองของเพียร์สันและระดับความเป็นอิสระของมัน เงื่อนไขจำนวนที่คาดการณ์ที่รองรับการประมาณค่าไคกำลังสอง การแก้ไขความต่อเนื่อง (Yates) ตรรกะของการทดสอบฟิชเชอร์แบบแม่นยำโดยอิงจากการแจกแจงแบบไฮเปอร์จีออเมตริก และคำถามเชิงปฏิบัติว่าเมื่อใดที่การทดสอบแบบแม่นยำควรเข้ามาแทนที่การประมาณค่า บทความนี้นำเสนอสิ่งเหล่านี้เป็นการทดสอบความสัมพันธ์ ไม่ใช่คำแนะนำทางคลินิก และตั้งข้อสังเกตว่าสิ่งเหล่านี้ประเมินว่ามีความสัมพันธ์อยู่หรือไม่ ไม่ใช่ว่าความสัมพันธ์นั้นมีขนาดใหญ่เพียงใด
Core questions
- ตัวแปรเชิงหมวดหมู่สองตัวในตารางนี้เป็นอิสระต่อกัน หรือมีหลักฐานของความสัมพันธ์หรือไม่?
- สถิติไคกำลังสองถูกสร้างขึ้นจากจำนวนที่สังเกตได้และที่คาดการณ์ได้อย่างไร และมีระดับความเป็นอิสระเท่าใด?
- เมื่อใดที่จำนวนที่คาดการณ์มีน้อยเกินไปจนไม่สามารถเชื่อถือการประมาณค่าไคกำลังสองได้?
- การทดสอบฟิชเชอร์แบบแม่นยำหลีกเลี่ยงการประมาณค่าตัวอย่างขนาดใหญ่ได้อย่างไร และ “การกำหนดเงื่อนไขบนขอบเขต” หมายความว่าอย่างไร?
Key concepts
- จำนวนที่สังเกตได้เทียบกับจำนวนที่คาดการณ์
- สถิติไคกำลังสองของเพียร์สัน
- ระดับความเป็นอิสระ (r-1)(c-1)
- การประมาณค่าตัวอย่างขนาดใหญ่ (asymptotic)
- กฎทั่วไปของจำนวนที่คาดการณ์
- การแก้ไขความต่อเนื่องของ Yates
- การแจกแจงแบบไฮเปอร์จีออเมตริกและขอบเขตที่คงที่
- ค่า p-value แบบแม่นยำเทียบกับแบบ asymptotic
Mechanisms
ภายใต้ความเป็นอิสระ จำนวนที่คาดการณ์ของแต่ละเซลล์คือผลรวมของแถวคูณด้วยผลรวมของคอลัมน์หารด้วยผลรวมทั้งหมด สถิติไคกำลังสองของเพียร์สันจะรวมผลต่างกำลังสองระหว่างจำนวนที่สังเกตได้และที่คาดการณ์หารด้วยจำนวนที่คาดการณ์ในทุกเซลล์; สำหรับตาราง r×c สถิตินี้จะถูกเปรียบเทียบกับการแจกแจงไคกำลังสองที่มีระดับความเป็นอิสระ (r−1)(c−1) ซึ่งเป็นผลลัพธ์ของระดับความเป็นอิสระที่ฟิชเชอร์ชี้แจงในปี 1922 การประมาณค่าจะเสื่อมลงเมื่อจำนวนที่คาดการณ์มีน้อย ทำให้เกิดแนวทางปฏิบัติทั่วไปที่ว่าจำนวนที่คาดการณ์โดยทั่วไปควรเกินประมาณห้า; การแก้ไขความต่อเนื่องของ Yates ได้รับการเสนอเพื่อปรับปรุงการประมาณค่า 2×2 การทดสอบฟิชเชอร์แบบแม่นยำหลีกเลี่ยงการประมาณค่าโดยการถือว่าขอบเขตของแถวและคอลัมน์คงที่และคำนวณจาก การแจกแจงแบบไฮเปอร์จีออเมตริก ความน่าจะเป็นที่แน่นอนของตารางที่สังเกตได้และของทุกตารางที่รุนแรงกว่า โดยรวมเข้าเป็นค่า p-value เนื่องจากเป็นค่าที่แม่นยำ จึงเป็นที่นิยมสำหรับตารางที่มีข้อมูลน้อย แม้ว่าการทบทวนจะตั้งข้อสังเกตถึงลักษณะที่เป็นเงื่อนไขและอนุรักษ์นิยม และแนะนำทางเลือกเฉพาะในการทดสอบที่มีอยู่
Clinical relevance
ไม่ว่าการศึกษาจะรายงานว่าการสัมผัสมีความสัมพันธ์กับผลลัพธ์หรือไม่ มักจะขึ้นอยู่กับการทดสอบเหล่านี้ ดังนั้นการทำความเข้าใจว่าการทดสอบเหล่านี้ทำอะไร — และการที่ค่า p-value ขนาดเล็กบ่งชี้ถึงความสัมพันธ์แต่ไม่ได้บอกอะไรเกี่ยวกับขนาดของมัน — เป็นส่วนหนึ่งของการประเมินงานวิจัยด้านสุขภาพ การทดสอบเหล่านี้เป็นเครื่องมือในการประเมินหลักฐานของความสัมพันธ์และไม่ใช่พื้นฐานสำหรับการตัดสินใจวินิจฉัยหรือการรักษาเฉพาะบุคคล
Epidemiology
การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำเป็นการทดสอบนัยสำคัญเริ่มต้นสำหรับตารางความบังเอิญขนาด 2×2 และใหญ่กว่าในระบาดวิทยาและการวิจัยทางคลินิก โดยมาพร้อมกับอัตราส่วนความเสี่ยงและอัตราส่วนความน่าจะเป็นที่วัดความสัมพันธ์เดียวกัน การทดสอบแบบแม่นยำมักถูกนำมาใช้สำหรับตัวอย่างขนาดเล็กหรือเหตุการณ์ที่หายากซึ่งการประมาณค่าไคกำลังสองไม่น่าเชื่อถือ
History
คาร์ล เพียร์สันได้นำเสนอสถิติความเหมาะสมของไคกำลังสองในปี 1900; บทความของฟิชเชอร์ในปี 1922 ได้แก้ไขระดับความเป็นอิสระสำหรับตารางความบังเอิญ และฟิชเชอร์ได้คิดค้นการทดสอบแบบแม่นยำที่ใช้ชื่อของเขาสำหรับตัวอย่างขนาดเล็ก Yates ได้เสนอการแก้ไขความต่อเนื่องของเขาสำหรับตาราง 2×2 ในปี 1934 คำแนะนำสมัยใหม่ในหมู่ขั้นตอนเหล่านี้และขั้นตอนที่เกี่ยวข้องได้รับการสังเคราะห์ในการทบทวนวิธีการและตำราเรียน
Debates
- การทดสอบแบบแม่นยำเทียบกับการทดสอบแบบ asymptotic สำหรับตาราง 2×2 ขนาดเล็ก
- การทดสอบฟิชเชอร์แบบแม่นยำกำหนดเงื่อนไขบนขอบเขตทั้งสองและเป็นค่าที่แม่นยำแต่มีแนวโน้มที่จะอนุรักษ์นิยม ในขณะที่ไคกำลังสองที่ไม่ได้แก้ไขอาจไม่เป็นอนุรักษ์นิยมสำหรับตัวอย่างขนาดเล็กและการแก้ไขของ Yates แก้ไขมากเกินไป; ดังนั้นการทบทวนจึงให้คำแนะนำที่ละเอียดอ่อนมากกว่ากฎเดียว
Key figures
- Karl Pearson
- Ronald A. Fisher
- Frank Yates
- Alan Agresti
Related topics
Seminal works
- pearson-1900
- fisher-1922
- lydersen-2009
Frequently asked questions
- ควรใช้การทดสอบฟิชเชอร์แบบแม่นยำแทนการทดสอบไคกำลังสองเมื่อใด?
- เมื่อตารางมีขนาดเล็กหรือมีข้อมูลน้อย — โดยทั่วไปเมื่อจำนวนเซลล์ที่คาดการณ์หนึ่งเซลล์หรือมากกว่านั้นมีค่าน้อย — การประมาณค่าตัวอย่างขนาดใหญ่ของไคกำลังสองอาจไม่น่าเชื่อถือ และการทดสอบฟิชเชอร์แบบแม่นยำซึ่งคำนวณความน่าจะเป็นที่แน่นอนจะได้รับความนิยมมากกว่า
- การทดสอบไคกำลังสองที่มีนัยสำคัญบอกฉันถึงความแข็งแกร่งของความสัมพันธ์หรือไม่?
- ไม่ การทดสอบเหล่านี้บ่งชี้ว่ามีหลักฐานของความสัมพันธ์หรือไม่ ขนาดของความสัมพันธ์จะถูกสื่อโดยมาตรวัดผลกระทบแยกต่างหาก เช่น อัตราส่วนความเสี่ยงหรืออัตราส่วนความน่าจะเป็น ซึ่งควรรายงานควบคู่ไปกับค่า p-value