ควรใช้การทดสอบฟิชเชอร์แบบแม่นยำแทนการทดสอบไคกำลังสองเมื่อใด?

เมื่อตารางมีขนาดเล็กหรือมีข้อมูลน้อย — โดยทั่วไปเมื่อจำนวนเซลล์ที่คาดการณ์หนึ่งเซลล์หรือมากกว่านั้นมีค่าน้อย — การประมาณค่าตัวอย่างขนาดใหญ่ของไคกำลังสองอาจไม่น่าเชื่อถือ และการทดสอบฟิชเชอร์แบบแม่นยำซึ่งคำนวณความน่าจะเป็นที่แน่นอนจะได้รับความนิยมมากกว่า

การทดสอบไคกำลังสองที่มีนัยสำคัญบอกฉันถึงความแข็งแกร่งของความสัมพันธ์หรือไม่?

ไม่ การทดสอบเหล่านี้บ่งชี้ว่ามีหลักฐานของความสัมพันธ์หรือไม่ ขนาดของความสัมพันธ์จะถูกสื่อโดยมาตรวัดผลกระทบแยกต่างหาก เช่น อัตราส่วนความเสี่ยงหรืออัตราส่วนความน่าจะเป็น ซึ่งควรรายงานควบคู่ไปกับค่า p-value

การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำ

การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำเป็นขั้นตอนมาตรฐานสองประการในการสอบถามว่าตัวแปรเชิงหมวดหมู่สองตัวในตารางความบังเอิญมีความสัมพันธ์กันหรือเป็นอิสระต่อกัน การทดสอบไคกำลังสองเปรียบเทียบจำนวนเซลล์ที่สังเกตได้กับจำนวนที่คาดการณ์ภายใต้ความเป็นอิสระโดยใช้การประมาณค่าตัวอย่างขนาดใหญ่ ในขณะที่การทดสอบฟิชเชอร์แบบแม่นยำจะคำนวณความน่าจะเป็นของตารางที่สังเกตได้โดยตรงและใช้เมื่อจำนวนข้อมูลมีน้อย

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การทดสอบไคกำลังสองของความสัมพันธ์วัดความคลาดเคลื่อนระหว่างจำนวนเซลล์ที่สังเกตได้และที่คาดการณ์ภายใต้สมมติฐานว่างของความเป็นอิสระ โดยอ้างอิงสถิติที่ได้กับการแจกแจงไคกำลังสอง; ในทางกลับกัน การทดสอบฟิชเชอร์แบบแม่นยำจะคำนวณจาก การแจกแจงแบบไฮเปอร์จีออเมตริก โดยที่ขอบเขตถูกกำหนดไว้ ความน่าจะเป็นที่แน่นอนของตารางที่สังเกตได้และของทุกตารางที่รุนแรงกว่า

Scope

บทความนี้ครอบคลุมสถิติไคกำลังสองของเพียร์สันและระดับความเป็นอิสระของมัน เงื่อนไขจำนวนที่คาดการณ์ที่รองรับการประมาณค่าไคกำลังสอง การแก้ไขความต่อเนื่อง (Yates) ตรรกะของการทดสอบฟิชเชอร์แบบแม่นยำโดยอิงจากการแจกแจงแบบไฮเปอร์จีออเมตริก และคำถามเชิงปฏิบัติว่าเมื่อใดที่การทดสอบแบบแม่นยำควรเข้ามาแทนที่การประมาณค่า บทความนี้นำเสนอสิ่งเหล่านี้เป็นการทดสอบความสัมพันธ์ ไม่ใช่คำแนะนำทางคลินิก และตั้งข้อสังเกตว่าสิ่งเหล่านี้ประเมินว่ามีความสัมพันธ์อยู่หรือไม่ ไม่ใช่ว่าความสัมพันธ์นั้นมีขนาดใหญ่เพียงใด

Core questions

ตัวแปรเชิงหมวดหมู่สองตัวในตารางนี้เป็นอิสระต่อกัน หรือมีหลักฐานของความสัมพันธ์หรือไม่?
สถิติไคกำลังสองถูกสร้างขึ้นจากจำนวนที่สังเกตได้และที่คาดการณ์ได้อย่างไร และมีระดับความเป็นอิสระเท่าใด?
เมื่อใดที่จำนวนที่คาดการณ์มีน้อยเกินไปจนไม่สามารถเชื่อถือการประมาณค่าไคกำลังสองได้?
การทดสอบฟิชเชอร์แบบแม่นยำหลีกเลี่ยงการประมาณค่าตัวอย่างขนาดใหญ่ได้อย่างไร และ “การกำหนดเงื่อนไขบนขอบเขต” หมายความว่าอย่างไร?

Key concepts

จำนวนที่สังเกตได้เทียบกับจำนวนที่คาดการณ์
สถิติไคกำลังสองของเพียร์สัน
ระดับความเป็นอิสระ (r-1)(c-1)
การประมาณค่าตัวอย่างขนาดใหญ่ (asymptotic)
กฎทั่วไปของจำนวนที่คาดการณ์
การแก้ไขความต่อเนื่องของ Yates
การแจกแจงแบบไฮเปอร์จีออเมตริกและขอบเขตที่คงที่
ค่า p-value แบบแม่นยำเทียบกับแบบ asymptotic

Mechanisms

ภายใต้ความเป็นอิสระ จำนวนที่คาดการณ์ของแต่ละเซลล์คือผลรวมของแถวคูณด้วยผลรวมของคอลัมน์หารด้วยผลรวมทั้งหมด สถิติไคกำลังสองของเพียร์สันจะรวมผลต่างกำลังสองระหว่างจำนวนที่สังเกตได้และที่คาดการณ์หารด้วยจำนวนที่คาดการณ์ในทุกเซลล์; สำหรับตาราง r×c สถิตินี้จะถูกเปรียบเทียบกับการแจกแจงไคกำลังสองที่มีระดับความเป็นอิสระ (r−1)(c−1) ซึ่งเป็นผลลัพธ์ของระดับความเป็นอิสระที่ฟิชเชอร์ชี้แจงในปี 1922 การประมาณค่าจะเสื่อมลงเมื่อจำนวนที่คาดการณ์มีน้อย ทำให้เกิดแนวทางปฏิบัติทั่วไปที่ว่าจำนวนที่คาดการณ์โดยทั่วไปควรเกินประมาณห้า; การแก้ไขความต่อเนื่องของ Yates ได้รับการเสนอเพื่อปรับปรุงการประมาณค่า 2×2 การทดสอบฟิชเชอร์แบบแม่นยำหลีกเลี่ยงการประมาณค่าโดยการถือว่าขอบเขตของแถวและคอลัมน์คงที่และคำนวณจาก การแจกแจงแบบไฮเปอร์จีออเมตริก ความน่าจะเป็นที่แน่นอนของตารางที่สังเกตได้และของทุกตารางที่รุนแรงกว่า โดยรวมเข้าเป็นค่า p-value เนื่องจากเป็นค่าที่แม่นยำ จึงเป็นที่นิยมสำหรับตารางที่มีข้อมูลน้อย แม้ว่าการทบทวนจะตั้งข้อสังเกตถึงลักษณะที่เป็นเงื่อนไขและอนุรักษ์นิยม และแนะนำทางเลือกเฉพาะในการทดสอบที่มีอยู่

Clinical relevance

ไม่ว่าการศึกษาจะรายงานว่าการสัมผัสมีความสัมพันธ์กับผลลัพธ์หรือไม่ มักจะขึ้นอยู่กับการทดสอบเหล่านี้ ดังนั้นการทำความเข้าใจว่าการทดสอบเหล่านี้ทำอะไร — และการที่ค่า p-value ขนาดเล็กบ่งชี้ถึงความสัมพันธ์แต่ไม่ได้บอกอะไรเกี่ยวกับขนาดของมัน — เป็นส่วนหนึ่งของการประเมินงานวิจัยด้านสุขภาพ การทดสอบเหล่านี้เป็นเครื่องมือในการประเมินหลักฐานของความสัมพันธ์และไม่ใช่พื้นฐานสำหรับการตัดสินใจวินิจฉัยหรือการรักษาเฉพาะบุคคล

Epidemiology

การทดสอบไคกำลังสองและการทดสอบฟิชเชอร์แบบแม่นยำเป็นการทดสอบนัยสำคัญเริ่มต้นสำหรับตารางความบังเอิญขนาด 2×2 และใหญ่กว่าในระบาดวิทยาและการวิจัยทางคลินิก โดยมาพร้อมกับอัตราส่วนความเสี่ยงและอัตราส่วนความน่าจะเป็นที่วัดความสัมพันธ์เดียวกัน การทดสอบแบบแม่นยำมักถูกนำมาใช้สำหรับตัวอย่างขนาดเล็กหรือเหตุการณ์ที่หายากซึ่งการประมาณค่าไคกำลังสองไม่น่าเชื่อถือ

History

คาร์ล เพียร์สันได้นำเสนอสถิติความเหมาะสมของไคกำลังสองในปี 1900; บทความของฟิชเชอร์ในปี 1922 ได้แก้ไขระดับความเป็นอิสระสำหรับตารางความบังเอิญ และฟิชเชอร์ได้คิดค้นการทดสอบแบบแม่นยำที่ใช้ชื่อของเขาสำหรับตัวอย่างขนาดเล็ก Yates ได้เสนอการแก้ไขความต่อเนื่องของเขาสำหรับตาราง 2×2 ในปี 1934 คำแนะนำสมัยใหม่ในหมู่ขั้นตอนเหล่านี้และขั้นตอนที่เกี่ยวข้องได้รับการสังเคราะห์ในการทบทวนวิธีการและตำราเรียน

Debates

การทดสอบแบบแม่นยำเทียบกับการทดสอบแบบ asymptotic สำหรับตาราง 2×2 ขนาดเล็ก: การทดสอบฟิชเชอร์แบบแม่นยำกำหนดเงื่อนไขบนขอบเขตทั้งสองและเป็นค่าที่แม่นยำแต่มีแนวโน้มที่จะอนุรักษ์นิยม ในขณะที่ไคกำลังสองที่ไม่ได้แก้ไขอาจไม่เป็นอนุรักษ์นิยมสำหรับตัวอย่างขนาดเล็กและการแก้ไขของ Yates แก้ไขมากเกินไป; ดังนั้นการทบทวนจึงให้คำแนะนำที่ละเอียดอ่อนมากกว่ากฎเดียว

Key figures

Karl Pearson
Ronald A. Fisher
Frank Yates
Alan Agresti

Seminal works

pearson-1900
fisher-1922
lydersen-2009

Frequently asked questions

ควรใช้การทดสอบฟิชเชอร์แบบแม่นยำแทนการทดสอบไคกำลังสองเมื่อใด?: เมื่อตารางมีขนาดเล็กหรือมีข้อมูลน้อย — โดยทั่วไปเมื่อจำนวนเซลล์ที่คาดการณ์หนึ่งเซลล์หรือมากกว่านั้นมีค่าน้อย — การประมาณค่าตัวอย่างขนาดใหญ่ของไคกำลังสองอาจไม่น่าเชื่อถือ และการทดสอบฟิชเชอร์แบบแม่นยำซึ่งคำนวณความน่าจะเป็นที่แน่นอนจะได้รับความนิยมมากกว่า
การทดสอบไคกำลังสองที่มีนัยสำคัญบอกฉันถึงความแข็งแกร่งของความสัมพันธ์หรือไม่?: ไม่ การทดสอบเหล่านี้บ่งชี้ว่ามีหลักฐานของความสัมพันธ์หรือไม่ ขนาดของความสัมพันธ์จะถูกสื่อโดยมาตรวัดผลกระทบแยกต่างหาก เช่น อัตราส่วนความเสี่ยงหรืออัตราส่วนความน่าจะเป็น ซึ่งควรรายงานควบคู่ไปกับค่า p-value