การทดสอบทางจิตวิทยาและจิตวิทยาการวัด
จิตวิทยาการวัด (Psychometrics) คือศาสตร์แห่งการวัดคุณลักษณะทางจิตวิทยา: วิธีการสร้างแบบทดสอบ, วิธีการหาปริมาณคะแนน, และวิธีการสร้างความน่าเชื่อถือ (reliability), ความเที่ยงตรง (validity) และความเป็นธรรม (fairness) เพื่อให้ตัวเลขที่ได้จากแบบทดสอบสามารถตีความได้อย่างมั่นใจ
Definition
จิตวิทยาการวัด (Psychometrics) เป็นสาขาหนึ่งของจิตวิทยาที่เกี่ยวข้องกับทฤษฎีและเทคนิคของการวัดทางจิตวิทยา ซึ่งรวมถึงการออกแบบ การบริหารจัดการ การให้คะแนน และการตรวจสอบความเที่ยงตรงของแบบทดสอบ รวมถึงแบบจำลองทางสถิติที่เชื่อมโยงคะแนนที่สังเกตได้กับคุณลักษณะพื้นฐาน
Scope
หัวข้อนี้ครอบคลุมทฤษฎีและวิธีการที่เปลี่ยนการตอบสนองให้เป็นคะแนนที่สามารถตีความได้: ทฤษฎีการทดสอบแบบดั้งเดิม (classical test theory) และแบบจำลองคะแนนจริง (true-score model), ความน่าเชื่อถือและข้อผิดพลาดในการวัด, กรอบแนวคิดความเที่ยงตรง, การวิเคราะห์ระดับข้อสอบ, การสร้างบรรทัดฐานและการกำหนดมาตรฐาน, และความเป็นธรรมของแบบทดสอบ เป็นเนื้อหาเชิงระเบียบวิธีเกี่ยวกับการวัด ไม่ใช่คำแนะนำในการเลือกหรือให้คะแนนแบบทดสอบสำหรับบุคคลใดบุคคลหนึ่ง
Core questions
- คะแนนที่สังเกตได้สะท้อนถึงคุณลักษณะเทียบกับความคลาดเคลื่อนในการวัดมากน้อยเพียงใด?
- ต้องมีหลักฐานอะไรบ้างก่อนที่จะสามารถตีความคะแนนว่าเป็นการวัดแนวคิดที่ตั้งใจไว้?
- ข้อสอบถูกวิเคราะห์ เลือก และปรับขนาดอย่างไร?
- คะแนนถูกทำให้เปรียบเทียบกันได้ระหว่างบุคคลผ่านบรรทัดฐานและการกำหนดมาตรฐานได้อย่างไร?
Key concepts
- คะแนนจริงและความคลาดเคลื่อนในการวัด
- ความน่าเชื่อถือ (ความสอดคล้องภายใน, การทดสอบซ้ำ, ความสอดคล้องระหว่างผู้ให้คะแนน)
- ความเที่ยงตรงเชิงเนื้อหา, เชิงเกณฑ์, และเชิงแนวคิด
- การวิเคราะห์ข้อสอบและความยาก/การจำแนก
- บรรทัดฐาน, การกำหนดมาตรฐาน, และคะแนนมาตรฐาน
- ทฤษฎีการตอบสนองข้อสอบ
- ความไม่แปรเปลี่ยนของการวัดและความเป็นธรรมของแบบทดสอบ
Key theories
- ทฤษฎีการทดสอบแบบดั้งเดิม
- ทฤษฎีการทดสอบแบบดั้งเดิมจำลองคะแนนที่สังเกตได้ว่าเป็นผลรวมของคะแนนจริงและความคลาดเคลื่อนแบบสุ่ม ซึ่งความน่าเชื่อถือถูกกำหนดให้เป็นสัดส่วนของความแปรปรวนของคะแนนที่สังเกตได้ที่เกิดจากความแปรปรวนของคะแนนจริง; Lord และ Novick ได้ให้สูตรทางสถิติที่เข้มงวดแก่สาขาวิชานี้
- ความเที่ยงตรงเชิงแนวคิดแบบรวม
- Cronbach และ Meehl ได้วางกรอบความเที่ยงตรงโดยรอบแนวคิดที่แบบทดสอบอนุมาน และ Messick ได้รวมหลักฐานเชิงเนื้อหา เชิงเกณฑ์ และเชิงแนวคิดเข้าเป็นข้อโต้แย้งเดียวเกี่ยวกับการให้เหตุผลและผลที่ตามมาของการตีความคะแนน
Mechanisms
ในแบบจำลองแบบดั้งเดิม คะแนนที่สังเกตได้ถือเป็นคะแนนจริงบวกกับความคลาดเคลื่อนแบบสุ่ม และความน่าเชื่อถือจะวัดสัดส่วนของความแปรปรวนที่เป็นความแปรปรวนของคะแนนจริง; Lord และ Novick ได้ทำให้สิ่งนี้เป็นทางการ รวมถึงแบบจำลองการตอบสนองข้อสอบในภายหลัง ความเที่ยงตรงคือการรับประกันว่าคะแนนสนับสนุนการอนุมานที่ตั้งใจไว้: Cronbach และ Meehl ได้ระบุไว้ในแนวคิด (construct) และเครือข่ายเชิงกฎเกณฑ์ (nomological network) ของมัน, Haynes และคณะได้อธิบายความเที่ยงตรงเชิงเนื้อหา (content validity) โดยละเอียดว่าเป็นการจับคู่ข้อสอบกับขอบเขตเป้าหมายอย่างเป็นระบบ, และ Messick ได้รวมประเภทของหลักฐานเข้าเป็นข้อโต้แย้งที่พิจารณาผลที่ตามมาของการตีความด้วย บรรทัดฐานและการกำหนดมาตรฐานทำให้คะแนนสามารถเปรียบเทียบกันได้โดยอ้างอิงกับประชากรที่กำหนดไว้
Clinical relevance
คุณสมบัติทางจิตวิทยาการวัดเป็นตัวกำหนดว่าคะแนนการทดสอบทางคลินิกสามารถเชื่อถือได้หรือไม่ และมีความหมายอย่างไร ดังนั้นหลักฐานความน่าเชื่อถือและความเที่ยงตรงจึงเป็นรากฐานของการใช้การทดสอบทางจิตวิทยาคลินิกที่สามารถป้องกันได้ทุกกรณี เนื้อหานี้อธิบายคุณสมบัติเหล่านั้นในฐานะแนวคิดการวัด; ไม่ได้แนะนำเครื่องมือหรือจุดตัดเฉพาะสำหรับบุคคลใดบุคคลหนึ่ง
Evidence & guidelines
มาตรฐานสำหรับการทดสอบทางการศึกษาและจิตวิทยา (The Standards for Educational and Psychological Testing) ได้กำหนดความคาดหวังสำหรับความน่าเชื่อถือ ความเที่ยงตรง และความเป็นธรรมในการพัฒนาและการใช้แบบทดสอบ Cronbach และ Meehl, Messick, และ Haynes และคณะ เป็นเอกสารอ้างอิงทางระเบียบวิธีมาตรฐานสำหรับกรอบแนวคิดความเที่ยงตรง และ Lord และ Novick เป็นคำกล่าวที่เป็นแบบฉบับของทฤษฎีการทดสอบแบบดั้งเดิมและการตอบสนองข้อสอบ
History
การวัดทางจิตใจเกิดขึ้นจากการศึกษาความแตกต่างระหว่างบุคคลในศตวรรษที่สิบเก้า และถูกจัดระบบเป็นทฤษฎีการทดสอบแบบดั้งเดิมในช่วงครึ่งแรกของศตวรรษที่ยี่สิบ บทความของ Cronbach และ Meehl ในปี 1955 ทำให้ความเที่ยงตรงเชิงแนวคิด (construct validity) เป็นศูนย์กลาง, วิทยานิพนธ์ของ Lord และ Novick ในปี 1968 ได้วางรากฐานทางสถิติและการตอบสนองข้อสอบที่เข้มงวดให้กับสาขาวิชานี้, และการสังเคราะห์ในภายหลังของ Messick ได้รวมแนวคิดความเที่ยงตรงเข้ากับการให้เหตุผลของการอนุมานและผลกระทบทางสังคม
Debates
- ความเที่ยงตรงเป็นคุณสมบัติของแบบทดสอบหรือของการอนุมาน?
- สาขาวิชานี้ส่วนใหญ่ได้เปลี่ยนจากการพูดถึงแบบทดสอบที่เที่ยงตรงไปสู่การตรวจสอบความเที่ยงตรงของการอนุมานและการใช้งานที่ได้จากคะแนน โดยยังคงมีการถกเถียงกันว่าผลที่ตามมาของการทดสอบควรเป็นส่วนหนึ่งของแนวคิดความเที่ยงตรงมากน้อยเพียงใด
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
Related topics
Seminal works
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Frequently asked questions
- ความน่าเชื่อถือและความเที่ยงตรงแตกต่างกันอย่างไร?
- ความน่าเชื่อถือคือความสอดคล้องของการวัด (ได้รับผลกระทบจากความคลาดเคลื่อนแบบสุ่มน้อยเพียงใด) ในขณะที่ความเที่ยงตรงคือการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่; แบบทดสอบอาจมีความน่าเชื่อถือโดยไม่เที่ยงตรงสำหรับวัตถุประสงค์ที่กำหนด แต่ไม่สามารถเที่ยงตรงได้หากไม่มีความน่าเชื่อถือที่สมเหตุสมผล
- ความเที่ยงตรงเชิงแนวคิดหมายความว่าอย่างไร?
- คือระดับที่แบบทดสอบสามารถตีความได้ว่าเป็นการวัดคุณลักษณะที่ตั้งใจไว้และถูกกำหนดตามทฤษฎี ซึ่งสร้างขึ้นโดยการรวบรวมหลักฐานว่าแบบทดสอบมีความสัมพันธ์กับตัวแปรอื่น ๆ ตามที่ทฤษฎีคาดการณ์ไว้