ความน่าเชื่อถือและความเที่ยงตรงแตกต่างกันอย่างไร?

ความน่าเชื่อถือคือความสอดคล้องของการวัด (ได้รับผลกระทบจากความคลาดเคลื่อนแบบสุ่มน้อยเพียงใด) ในขณะที่ความเที่ยงตรงคือการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่; แบบทดสอบอาจมีความน่าเชื่อถือโดยไม่เที่ยงตรงสำหรับวัตถุประสงค์ที่กำหนด แต่ไม่สามารถเที่ยงตรงได้หากไม่มีความน่าเชื่อถือที่สมเหตุสมผล

ความเที่ยงตรงเชิงแนวคิดหมายความว่าอย่างไร?

คือระดับที่แบบทดสอบสามารถตีความได้ว่าเป็นการวัดคุณลักษณะที่ตั้งใจไว้และถูกกำหนดตามทฤษฎี ซึ่งสร้างขึ้นโดยการรวบรวมหลักฐานว่าแบบทดสอบมีความสัมพันธ์กับตัวแปรอื่น ๆ ตามที่ทฤษฎีคาดการณ์ไว้

การทดสอบทางจิตวิทยาและจิตวิทยาการวัด

จิตวิทยาการวัด (Psychometrics) คือศาสตร์แห่งการวัดคุณลักษณะทางจิตวิทยา: วิธีการสร้างแบบทดสอบ, วิธีการหาปริมาณคะแนน, และวิธีการสร้างความน่าเชื่อถือ (reliability), ความเที่ยงตรง (validity) และความเป็นธรรม (fairness) เพื่อให้ตัวเลขที่ได้จากแบบทดสอบสามารถตีความได้อย่างมั่นใจ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

จิตวิทยาการวัด (Psychometrics) เป็นสาขาหนึ่งของจิตวิทยาที่เกี่ยวข้องกับทฤษฎีและเทคนิคของการวัดทางจิตวิทยา ซึ่งรวมถึงการออกแบบ การบริหารจัดการ การให้คะแนน และการตรวจสอบความเที่ยงตรงของแบบทดสอบ รวมถึงแบบจำลองทางสถิติที่เชื่อมโยงคะแนนที่สังเกตได้กับคุณลักษณะพื้นฐาน

Scope

หัวข้อนี้ครอบคลุมทฤษฎีและวิธีการที่เปลี่ยนการตอบสนองให้เป็นคะแนนที่สามารถตีความได้: ทฤษฎีการทดสอบแบบดั้งเดิม (classical test theory) และแบบจำลองคะแนนจริง (true-score model), ความน่าเชื่อถือและข้อผิดพลาดในการวัด, กรอบแนวคิดความเที่ยงตรง, การวิเคราะห์ระดับข้อสอบ, การสร้างบรรทัดฐานและการกำหนดมาตรฐาน, และความเป็นธรรมของแบบทดสอบ เป็นเนื้อหาเชิงระเบียบวิธีเกี่ยวกับการวัด ไม่ใช่คำแนะนำในการเลือกหรือให้คะแนนแบบทดสอบสำหรับบุคคลใดบุคคลหนึ่ง

Core questions

คะแนนที่สังเกตได้สะท้อนถึงคุณลักษณะเทียบกับความคลาดเคลื่อนในการวัดมากน้อยเพียงใด?
ต้องมีหลักฐานอะไรบ้างก่อนที่จะสามารถตีความคะแนนว่าเป็นการวัดแนวคิดที่ตั้งใจไว้?
ข้อสอบถูกวิเคราะห์ เลือก และปรับขนาดอย่างไร?
คะแนนถูกทำให้เปรียบเทียบกันได้ระหว่างบุคคลผ่านบรรทัดฐานและการกำหนดมาตรฐานได้อย่างไร?

Key concepts

คะแนนจริงและความคลาดเคลื่อนในการวัด
ความน่าเชื่อถือ (ความสอดคล้องภายใน, การทดสอบซ้ำ, ความสอดคล้องระหว่างผู้ให้คะแนน)
ความเที่ยงตรงเชิงเนื้อหา, เชิงเกณฑ์, และเชิงแนวคิด
การวิเคราะห์ข้อสอบและความยาก/การจำแนก
บรรทัดฐาน, การกำหนดมาตรฐาน, และคะแนนมาตรฐาน
ทฤษฎีการตอบสนองข้อสอบ
ความไม่แปรเปลี่ยนของการวัดและความเป็นธรรมของแบบทดสอบ

Key theories

ทฤษฎีการทดสอบแบบดั้งเดิม: ทฤษฎีการทดสอบแบบดั้งเดิมจำลองคะแนนที่สังเกตได้ว่าเป็นผลรวมของคะแนนจริงและความคลาดเคลื่อนแบบสุ่ม ซึ่งความน่าเชื่อถือถูกกำหนดให้เป็นสัดส่วนของความแปรปรวนของคะแนนที่สังเกตได้ที่เกิดจากความแปรปรวนของคะแนนจริง; Lord และ Novick ได้ให้สูตรทางสถิติที่เข้มงวดแก่สาขาวิชานี้
ความเที่ยงตรงเชิงแนวคิดแบบรวม: Cronbach และ Meehl ได้วางกรอบความเที่ยงตรงโดยรอบแนวคิดที่แบบทดสอบอนุมาน และ Messick ได้รวมหลักฐานเชิงเนื้อหา เชิงเกณฑ์ และเชิงแนวคิดเข้าเป็นข้อโต้แย้งเดียวเกี่ยวกับการให้เหตุผลและผลที่ตามมาของการตีความคะแนน

Mechanisms

ในแบบจำลองแบบดั้งเดิม คะแนนที่สังเกตได้ถือเป็นคะแนนจริงบวกกับความคลาดเคลื่อนแบบสุ่ม และความน่าเชื่อถือจะวัดสัดส่วนของความแปรปรวนที่เป็นความแปรปรวนของคะแนนจริง; Lord และ Novick ได้ทำให้สิ่งนี้เป็นทางการ รวมถึงแบบจำลองการตอบสนองข้อสอบในภายหลัง ความเที่ยงตรงคือการรับประกันว่าคะแนนสนับสนุนการอนุมานที่ตั้งใจไว้: Cronbach และ Meehl ได้ระบุไว้ในแนวคิด (construct) และเครือข่ายเชิงกฎเกณฑ์ (nomological network) ของมัน, Haynes และคณะได้อธิบายความเที่ยงตรงเชิงเนื้อหา (content validity) โดยละเอียดว่าเป็นการจับคู่ข้อสอบกับขอบเขตเป้าหมายอย่างเป็นระบบ, และ Messick ได้รวมประเภทของหลักฐานเข้าเป็นข้อโต้แย้งที่พิจารณาผลที่ตามมาของการตีความด้วย บรรทัดฐานและการกำหนดมาตรฐานทำให้คะแนนสามารถเปรียบเทียบกันได้โดยอ้างอิงกับประชากรที่กำหนดไว้

Clinical relevance

คุณสมบัติทางจิตวิทยาการวัดเป็นตัวกำหนดว่าคะแนนการทดสอบทางคลินิกสามารถเชื่อถือได้หรือไม่ และมีความหมายอย่างไร ดังนั้นหลักฐานความน่าเชื่อถือและความเที่ยงตรงจึงเป็นรากฐานของการใช้การทดสอบทางจิตวิทยาคลินิกที่สามารถป้องกันได้ทุกกรณี เนื้อหานี้อธิบายคุณสมบัติเหล่านั้นในฐานะแนวคิดการวัด; ไม่ได้แนะนำเครื่องมือหรือจุดตัดเฉพาะสำหรับบุคคลใดบุคคลหนึ่ง

Evidence & guidelines

มาตรฐานสำหรับการทดสอบทางการศึกษาและจิตวิทยา (The Standards for Educational and Psychological Testing) ได้กำหนดความคาดหวังสำหรับความน่าเชื่อถือ ความเที่ยงตรง และความเป็นธรรมในการพัฒนาและการใช้แบบทดสอบ Cronbach และ Meehl, Messick, และ Haynes และคณะ เป็นเอกสารอ้างอิงทางระเบียบวิธีมาตรฐานสำหรับกรอบแนวคิดความเที่ยงตรง และ Lord และ Novick เป็นคำกล่าวที่เป็นแบบฉบับของทฤษฎีการทดสอบแบบดั้งเดิมและการตอบสนองข้อสอบ

History

การวัดทางจิตใจเกิดขึ้นจากการศึกษาความแตกต่างระหว่างบุคคลในศตวรรษที่สิบเก้า และถูกจัดระบบเป็นทฤษฎีการทดสอบแบบดั้งเดิมในช่วงครึ่งแรกของศตวรรษที่ยี่สิบ บทความของ Cronbach และ Meehl ในปี 1955 ทำให้ความเที่ยงตรงเชิงแนวคิด (construct validity) เป็นศูนย์กลาง, วิทยานิพนธ์ของ Lord และ Novick ในปี 1968 ได้วางรากฐานทางสถิติและการตอบสนองข้อสอบที่เข้มงวดให้กับสาขาวิชานี้, และการสังเคราะห์ในภายหลังของ Messick ได้รวมแนวคิดความเที่ยงตรงเข้ากับการให้เหตุผลของการอนุมานและผลกระทบทางสังคม

Debates

ความเที่ยงตรงเป็นคุณสมบัติของแบบทดสอบหรือของการอนุมาน?: สาขาวิชานี้ส่วนใหญ่ได้เปลี่ยนจากการพูดถึงแบบทดสอบที่เที่ยงตรงไปสู่การตรวจสอบความเที่ยงตรงของการอนุมานและการใช้งานที่ได้จากคะแนน โดยยังคงมีการถกเถียงกันว่าผลที่ตามมาของการทดสอบควรเป็นส่วนหนึ่งของแนวคิดความเที่ยงตรงมากน้อยเพียงใด

Key figures

Lee Cronbach
Paul Meehl
Samuel Messick
Frederic Lord
Melvin Novick

Seminal works

cronbach-meehl-1955
lord-novick-1968
messick-1995

Frequently asked questions

ความน่าเชื่อถือและความเที่ยงตรงแตกต่างกันอย่างไร?: ความน่าเชื่อถือคือความสอดคล้องของการวัด (ได้รับผลกระทบจากความคลาดเคลื่อนแบบสุ่มน้อยเพียงใด) ในขณะที่ความเที่ยงตรงคือการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่; แบบทดสอบอาจมีความน่าเชื่อถือโดยไม่เที่ยงตรงสำหรับวัตถุประสงค์ที่กำหนด แต่ไม่สามารถเที่ยงตรงได้หากไม่มีความน่าเชื่อถือที่สมเหตุสมผล
ความเที่ยงตรงเชิงแนวคิดหมายความว่าอย่างไร?: คือระดับที่แบบทดสอบสามารถตีความได้ว่าเป็นการวัดคุณลักษณะที่ตั้งใจไว้และถูกกำหนดตามทฤษฎี ซึ่งสร้างขึ้นโดยการรวบรวมหลักฐานว่าแบบทดสอบมีความสัมพันธ์กับตัวแปรอื่น ๆ ตามที่ทฤษฎีคาดการณ์ไว้