การทดสอบมาตรฐานและการประเมินอิงกลุ่มปกติ
การทดสอบมาตรฐานและการประเมินอิงกลุ่มปกติคือการใช้เครื่องมือที่เป็นทางการซึ่งดำเนินการและให้คะแนนภายใต้เงื่อนไขที่กำหนด เพื่อให้สามารถเปรียบเทียบผลการปฏิบัติงานของแต่ละบุคคลกับการกระจายของคะแนนที่ได้จากกลุ่มอ้างอิง (กลุ่มปกติ) ที่เป็นตัวแทน ในพยาธิวิทยาภาษาและการพูด เครื่องมือเหล่านี้ให้คะแนนมาตรฐาน อันดับเปอร์เซ็นไทล์ และเทียบเท่าอายุที่ใช้เพื่อสนับสนุนการตัดสินใจด้านคุณสมบัติ ความรุนแรง และการวินิจฉัย
Definition
การทดสอบอิงกลุ่มปกติคือการวัดที่ดำเนินการและให้คะแนนภายใต้เงื่อนไขมาตรฐาน และตีความโดยการเปรียบเทียบคะแนนดิบของแต่ละบุคคลกับการกระจายของคะแนนจากกลุ่มตัวอย่างปกติที่กำหนด ซึ่งโดยทั่วไปแสดงเป็นคะแนนมาตรฐานหรืออันดับเปอร์เซ็นไทล์
Scope
หัวข้อนี้ครอบคลุมตรรกะของการวัดอิงกลุ่มปกติ ความหมายของการทำให้เป็นมาตรฐาน คุณสมบัติทางจิตวิทยา (ความน่าเชื่อถือ ความถูกต้อง ความเพียงพอของกลุ่มปกติ) ที่กำหนดความน่าเชื่อถือของการทดสอบ ตลอดจนการตีความและข้อจำกัดของเกณฑ์การตัดคะแนน โดยถือว่าการทดสอบมาตรฐานเป็นรูปแบบหนึ่งของการประเมินในพยาธิวิทยาภาษาและการพูด และเป็นหัวข้อทางระเบียบวิธีวิจัย ไม่ใช่คำแนะนำสำหรับการทดสอบแต่ละบุคคล
Core questions
- คะแนนมาตรฐานบอกอะไรเราเกี่ยวกับแต่ละบุคคลเมื่อเทียบกับเพื่อนร่วมวัย?
- กลุ่มตัวอย่างปกติ ความน่าเชื่อถือ และความถูกต้องของการทดสอบต้องเพียงพอแค่ไหนก่อนที่คะแนนจะสามารถนำไปใช้ในการวินิจฉัยได้?
- ควรตั้งจุดตัดการวินิจฉัยไว้ที่ใด และการเลือกนั้นส่งผลต่อความไวและความจำเพาะอย่างไร?
- เมื่อใดที่การทดสอบอิงกลุ่มปกติเป็นเครื่องมือที่ไม่เหมาะสม และอะไรที่ควรเสริมการทดสอบนี้?
Key concepts
- การทำให้เป็นมาตรฐานของการบริหารและการให้คะแนน
- กลุ่มตัวอย่างปกติ (อ้างอิง)
- คะแนนมาตรฐาน, อันดับเปอร์เซ็นไทล์, เทียบเท่าอายุ
- ความน่าเชื่อถือ (การทดสอบซ้ำ, ความสอดคล้องภายใน)
- ความถูกต้อง (โครงสร้าง, เนื้อหา, เกณฑ์)
- ความไว, ความจำเพาะ, และจุดตัดการวินิจฉัย
- ความคลาดเคลื่อนมาตรฐานของการวัด
- การตีความอิงกลุ่มปกติเทียบกับการตีความอิงเกณฑ์
Mechanisms
การทดสอบจะถูกทำให้เป็นมาตรฐานโดยการกำหนดรายการ ขั้นตอนการบริหาร และกฎการให้คะแนน จากนั้นจึงนำไปใช้กับกลุ่มตัวอย่างปกติที่เลือกมาเพื่อเป็นตัวแทนของประชากรที่สนใจ คะแนนดิบของแต่ละบุคคลจะถูกแปลงโดยใช้การกระจายของกลุ่มตัวอย่างนั้น ให้เป็นคะแนนมาตรฐานหรือเปอร์เซ็นไทล์ที่ระบุตำแหน่งของบุคคลนั้นเทียบกับเพื่อนร่วมวัย คุณค่าในการตีความของตำแหน่งนี้ขึ้นอยู่กับความน่าเชื่อถือของการทดสอบ (ความสอดคล้องของการวัด) ความถูกต้อง (ว่าวัดสิ่งที่ตั้งใจจะวัดหรือไม่) และความเป็นตัวแทนของกลุ่มปกติ การใช้งานเพื่อการวินิจฉัยจะเพิ่มกฎการตัดสินใจ: จุดตัดที่ต่ำกว่านั้นถือว่าผลการปฏิบัติงานมีความผิดปกติ ซึ่งการกำหนดตำแหน่งของจุดตัดนี้จะควบคุมการแลกเปลี่ยนระหว่างความไวและความจำเพาะ (Spaulding, Plante, & Farinella, 2006)
Clinical relevance
คะแนนอิงกลุ่มปกติมักจะกำหนดคุณสมบัติในการรับบริการและความรุนแรงที่บันทึกไว้ของความผิดปกติทางการสื่อสาร ดังนั้นคุณภาพทางจิตวิทยาของคะแนนเหล่านี้จึงมีผลโดยตรงต่อผู้ที่ได้รับการระบุ รายการนี้อธิบายว่าคะแนนดังกล่าวได้มาและตีความอย่างไร และเงื่อนไขที่คะแนนเหล่านั้นน่าเชื่อถือ; เป็นแนวทางอ้างอิงและไม่ได้กำหนดวิธีการทดสอบหรือวินิจฉัยบุคคลใดบุคคลหนึ่งโดยเฉพาะ
Evidence & guidelines
การทบทวนระเบียบวิธีวิจัยพบซ้ำๆ ว่าการทดสอบภาษาและการออกเสียงที่ตีพิมพ์หลายรายการไม่เป็นไปตามเกณฑ์ทางจิตวิทยาพื้นฐานสำหรับความน่าเชื่อถือ ความถูกต้อง และความเพียงพอของกลุ่มปกติ โดยเตือนไม่ให้พึ่งพาคะแนนเหล่านั้นโดยไม่วิพากษ์วิจารณ์ (McCauley & Swisher, 1984) การวิเคราะห์เกณฑ์คุณสมบัติแสดงให้เห็นว่าจุดตัดทั่วไป (เช่น ผลการปฏิบัติงานที่ต่ำกว่าค่าเฉลี่ยหนึ่งหรือมากกว่าหนึ่งส่วนเบี่ยงเบนมาตรฐาน) ไม่ได้แยกแยะเด็กที่มีความบกพร่องทางภาษาออกจากเพื่อนร่วมวัยที่พัฒนาตามปกติได้อย่างสม่ำเสมอ เนื่องจากแบบทดสอบมีความแตกต่างกันในความแม่นยำในการวินิจฉัย (Spaulding et al., 2006) มาตรฐานสำหรับการทดสอบทางการศึกษาและจิตวิทยาได้กำหนดความคาดหวังทั่วไปสำหรับการพัฒนาแบบทดสอบ หลักฐานความถูกต้อง และการใช้งานที่เป็นธรรม (AERA, APA, & NCME, 2014)
History
การทดสอบอิงกลุ่มปกติในความผิดปกติทางการสื่อสารขยายตัวอย่างรวดเร็วในช่วงกลางศตวรรษที่ 20 ควบคู่ไปกับการเคลื่อนไหวทางจิตวิทยาที่กว้างขึ้นซึ่งถูกกำหนดโดยบุคคลเช่น Anastasi ภายในทศวรรษ 1980 การแพร่หลายของการทดสอบภาษาและการออกเสียงกระตุ้นให้เกิดการตรวจสอบทางจิตวิทยาอย่างเป็นระบบ (McCauley & Swisher, 1984) และงานวิจัยต่อมาได้เปลี่ยนเน้นจากจุดตัดที่สะดวกสบายไปสู่ความแม่นยำในการวินิจฉัยที่ได้รับการบันทึก และการบูรณาการคะแนนมาตรฐานเข้ากับหลักฐานการประเมินอื่นๆ (Spaulding et al., 2006)
Debates
- ผลการปฏิบัติงานที่ต่ำกว่าจุดตัดทั่วไปเพียงพอที่จะวินิจฉัยความบกพร่องหรือไม่?
- จุดตัดการวินิจฉัย เช่น -1 หรือ -1.25 ส่วนเบี่ยงเบนมาตรฐานมีการใช้อย่างแพร่หลาย แต่ความไวและความจำเพาะของจุดตัดเหล่านี้แตกต่างกันไปในแต่ละแบบทดสอบ การพึ่งพาเกณฑ์ทั่วไปเพียงอย่างเดียวอาจทำให้มีการระบุเด็กเกินไปหรือน้อยเกินไป ดังนั้นจุดตัดควรได้รับการพิสูจน์โดยความแม่นยำในการวินิจฉัยที่วัดได้ของแบบทดสอบ
- กลุ่มตัวอย่างปกติเป็นตัวแทนของประชากรที่หลากหลายได้ดีเพียงใด?
- เมื่อกลุ่มตัวอย่างปกติไม่ได้เป็นตัวแทนของภูมิหลังทางภาษาหรือวัฒนธรรมของบุคคล คะแนนมาตรฐานอาจบิดเบือนความสามารถ ทำให้เกิดคำถามที่ยาวนานเกี่ยวกับการใช้แบบทดสอบอิงกลุ่มปกติอย่างเป็นธรรมในประชากรต่างๆ
Key figures
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
Related topics
Seminal works
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Frequently asked questions
- ความแตกต่างระหว่างการประเมินอิงกลุ่มปกติและการประเมินอิงเกณฑ์คืออะไร?
- การประเมินอิงกลุ่มปกติเปรียบเทียบคะแนนของบุคคลกับค่าการกระจายของกลุ่มตัวอย่างอ้างอิงเพื่อแสดงตำแหน่งสัมพัทธ์ ในขณะที่การประเมินอิงเกณฑ์เปรียบเทียบผลการปฏิบัติงานกับทักษะหรือมาตรฐานที่กำหนดโดยไม่คำนึงถึงผลการปฏิบัติงานของเพื่อนร่วมวัย
- เหตุใดความคลาดเคลื่อนมาตรฐานของการวัดจึงมีความสำคัญ?
- เนื่องจากไม่มีแบบทดสอบใดที่น่าเชื่อถืออย่างสมบูรณ์ คะแนนที่ได้จึงเป็นค่าประมาณ; ความคลาดเคลื่อนมาตรฐานของการวัดจะระบุความไม่แน่นอนของคะแนน และเป็นเหตุผลว่าทำไมคะแนนจึงควรถูกตีความว่าเป็นช่วงความเชื่อมั่นมากกว่าจุดที่แน่นอน โดยเฉพาะอย่างยิ่งใกล้กับจุดตัดการวินิจฉัย