การวัดค่าความแปรปรวน
การวัดค่าความแปรปรวน หรือการกระจายตัว เป็นการระบุปริมาณว่าชุดข้อมูลที่สังเกตการณ์มีการกระจายตัวออกจากจุดศูนย์กลางมากน้อยเพียงใด ชุดข้อมูลสองชุดอาจมีค่าเฉลี่ยเท่ากัน แต่มีความแตกต่างกันอย่างมากในเรื่องของการรวมกลุ่มของค่าต่างๆ และการวัดค่าต่างๆ เช่น พิสัย, ความแปรปรวน, ส่วนเบี่ยงเบนมาตรฐาน และพิสัยระหว่างควอไทล์ สามารถจับความแตกต่างนั้นได้
Definition
การวัดค่าความแปรปรวนเป็นการระบุปริมาณการกระจายตัวของข้อมูลที่สังเกตการณ์รอบค่ากลาง: พิสัยคือความแตกต่างระหว่างค่าที่มากที่สุดและน้อยที่สุด, ความแปรปรวนคือค่าเฉลี่ยของกำลังสองของส่วนเบี่ยงเบนจากค่าเฉลี่ย, ส่วนเบี่ยงเบนมาตรฐานคือรากที่สองของค่าความแปรปรวนในหน่วยเดิม, และพิสัยระหว่างควอไทล์คือการกระจายตัวของข้อมูลครึ่งกลางของข้อมูลที่เรียงลำดับแล้ว
Scope
บทความนี้ครอบคลุมการวัดค่าการกระจายตัวหลัก ได้แก่ พิสัย, ความแปรปรวน, ส่วนเบี่ยงเบนมาตรฐาน และพิสัยระหว่างควอไทล์ รวมถึงวิธีการคำนวณและการตีความแต่ละค่า บทความนี้ยังแยกความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานกับความคลาดเคลื่อนมาตรฐาน และเป็นข้อมูลอ้างอิงทางระเบียบวิธีวิจัย ไม่ใช่แนวทางปฏิบัติทางคลินิก
Core questions
- ข้อมูลที่สังเกตการณ์มีการกระจายตัวรอบจุดศูนย์กลางกว้างเพียงใด?
- การวัดค่าการกระจายตัวใดที่เหมาะสมกับมาตรวัดตำแหน่งที่เลือก?
- ส่วนเบี่ยงเบนมาตรฐานแตกต่างจากความคลาดเคลื่อนมาตรฐานอย่างไร?
Key concepts
- พิสัย
- ความแปรปรวน
- ส่วนเบี่ยงเบนมาตรฐาน
- พิสัยระหว่างควอไทล์
- สัมประสิทธิ์การแปรผัน
- ส่วนเบี่ยงเบนมาตรฐานเทียบกับความคลาดเคลื่อนมาตรฐาน
- การจับคู่การกระจายตัวกับแนวโน้มเข้าสู่ส่วนกลาง
Mechanisms
พิสัย ซึ่งเป็นช่องว่างระหว่างค่าสุดขีด เป็นค่าที่เรียบง่ายแต่ไม่เสถียร เนื่องจากขึ้นอยู่กับค่าเพียงสองค่าและเพิ่มขึ้นตามขนาดตัวอย่าง ความแปรปรวนหาค่าเฉลี่ยของกำลังสองของส่วนเบี่ยงเบนของข้อมูลที่สังเกตการณ์จากค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐานจะแปลงปริมาณนั้นกลับไปเป็นหน่วยการวัดเดิม ทำให้เป็นค่าที่ใช้คู่กับค่าเฉลี่ยได้อย่างเป็นธรรมชาติสำหรับข้อมูลที่มีความสมมาตรโดยประมาณ พิสัยระหว่างควอไทล์ ซึ่งครอบคลุมเปอร์เซ็นไทล์ที่ 25 ถึง 75 อธิบายข้อมูลครึ่งกลางและมีความทนทานต่อค่าผิดปกติ ทำให้เป็นค่าที่ใช้คู่กับมัธยฐานสำหรับข้อมูลที่มีการแจกแจงแบบเบ้ แหล่งที่มาของความสับสนที่เกิดขึ้นซ้ำๆ คือความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐาน ซึ่งอธิบายการกระจายตัวของข้อมูลแต่ละรายการ และความคลาดเคลื่อนมาตรฐาน ซึ่งอธิบายความแม่นยำของการประมาณค่า เช่น ค่าเฉลี่ย และจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น
Clinical relevance
การวัดค่าการกระจายตัวช่วยให้ผู้อ่านทราบว่าการวัดหรือผลลัพธ์มีความแปรปรวนมากน้อยเพียงใด ซึ่งมีความสำคัญต่อการตัดสินความสอดคล้อง, ช่วงอ้างอิง และความแม่นยำของการประมาณค่าที่รายงาน บทความนี้อธิบายวิธีการสรุปความแปรปรวนสำหรับการประเมิน และไม่ใช่พื้นฐานสำหรับการตัดสินใจวินิจฉัยหรือการรักษาเฉพาะบุคคล
Epidemiology
การรายงานความแปรปรวนควบคู่ไปกับแนวโน้มเข้าสู่ส่วนกลางเป็นความคาดหวังพื้นฐานในการวิจัยด้านสุขภาพ และความแตกต่างระหว่างส่วนเบี่ยงเบนมาตรฐานกับความคลาดเคลื่อนมาตรฐานเป็นข้อผิดพลาดในการรายงานที่พบบ่อย: การสับสนระหว่างสองค่านี้อาจทำให้การประมาณค่าดูแม่นยำมากหรือน้อยกว่าที่เป็นจริง พิสัยระหว่างควอไทล์เป็นที่นิยมใช้เมื่อข้อมูลมีการแจกแจงแบบเบ้
History
ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานได้รับการจัดระเบียบอย่างเป็นทางการในช่วงปลายศตวรรษที่สิบเก้าและต้นศตวรรษที่ยี่สิบ โดยคำว่าส่วนเบี่ยงเบนมาตรฐานถูกนำเสนอโดย Karl Pearson และกรอบการวิเคราะห์ความแปรปรวนได้รับการพัฒนาโดย Ronald Fisher พิสัยระหว่างควอไทล์ที่แข็งแกร่งและอิงตามควอไทล์ได้รับความสำคัญมากขึ้นพร้อมกับการเพิ่มขึ้นของการวิเคราะห์ข้อมูลเชิงสำรวจและแผนภาพกล่อง (box plot) ในศตวรรษที่ยี่สิบ
Debates
- ส่วนเบี่ยงเบนมาตรฐานหรือความคลาดเคลื่อนมาตรฐานในการรายงาน?
- ผู้เขียนมักรายงานความคลาดเคลื่อนมาตรฐานแทนส่วนเบี่ยงเบนมาตรฐานเนื่องจากมีค่าน้อยกว่า ซึ่งอาจทำให้ผู้อ่านเข้าใจผิดเกี่ยวกับความแปรปรวนของข้อมูลที่สังเกตการณ์; แนวทางระเบียบวิธีวิจัยเน้นย้ำการรายงานส่วนเบี่ยงเบนมาตรฐานเพื่ออธิบายการกระจายตัว และสงวนความคลาดเคลื่อนมาตรฐานไว้สำหรับความแม่นยำของการประมาณค่า
Key figures
- Douglas G. Altman
- J. Martin Bland
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-dispersion
- altman-bland-2005
Frequently asked questions
- ส่วนเบี่ยงเบนมาตรฐานกับความคลาดเคลื่อนมาตรฐานแตกต่างกันอย่างไร?
- ส่วนเบี่ยงเบนมาตรฐานอธิบายว่าข้อมูลแต่ละรายการมีความแตกต่างจากค่าเฉลี่ยมากน้อยเพียงใด ในขณะที่ความคลาดเคลื่อนมาตรฐานอธิบายว่าค่าเฉลี่ยเองได้รับการประมาณค่าอย่างแม่นยำเพียงใด ความคลาดเคลื่อนมาตรฐานจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น; ส่วนเบี่ยงเบนมาตรฐานไม่ลดลง
- ควรใช้พิสัยระหว่างควอไทล์แทนส่วนเบี่ยงเบนมาตรฐานเมื่อใด?
- เมื่อข้อมูลมีการแจกแจงแบบเบ้หรือมีค่าผิดปกติ พิสัยระหว่างควอไทล์จะอธิบายการกระจายตัวได้อย่างแม่นยำกว่า เนื่องจากเช่นเดียวกับมัธยฐาน มันไม่ได้รับผลกระทบจากค่าสุดขีด