การประเมินและการทดสอบทางจิตวิทยา
การประเมินและการทดสอบทางจิตวิทยาเป็นสาขาหนึ่งของจิตวิทยาคลินิกที่เกี่ยวข้องกับการรวบรวม การวัด และการบูรณาการข้อมูลเกี่ยวกับความรู้ความเข้าใจ อารมณ์ บุคลิกภาพ และพฤติกรรมของบุคคล เพื่อตอบคำถามการส่งต่อ (referral question) ครอบคลุมถึงการทดสอบมาตรฐาน การสัมภาษณ์แบบมีโครงสร้าง การสังเกต และทฤษฎีการวัดที่ช่วยให้สามารถตีความคะแนนได้อย่างสมเหตุสมผล
Definition
การประเมินทางจิตวิทยาคือกระบวนการที่เป็นระบบในการรวบรวมและบูรณาการข้อมูลเกี่ยวกับบุคคล ซึ่งมักจะผ่านการทดสอบมาตรฐาน การสัมภาษณ์ การสังเกต และบันทึก เพื่ออธิบายการทำงานและตอบคำถามการส่งต่อ; การทดสอบเป็นการกระทำที่แคบกว่าในการใช้เครื่องมือมาตรฐานและได้มาซึ่งคะแนน
Scope
สาขานี้จะแนะนำผู้อ่านให้เข้าใจว่านักจิตวิทยาคลินิกได้รับและตีความข้อมูลเกี่ยวกับบุคคลอย่างไร: พื้นฐานทางจิตวิทยาของการวัด การสัมภาษณ์เพื่อการวินิจฉัย การประเมินความสามารถทางปัญญา การวัดบุคลิกภาพ และการสังเกตโดยตรงและการวิเคราะห์เชิงหน้าที่ของพฤติกรรม โดยถือว่าการประเมินเป็นโดเมนทางระเบียบวิธีและแนวคิด อธิบายถึงวิธีการสร้างและประเมินหลักฐานเกี่ยวกับบุคคล แทนที่จะกำหนดการทดสอบหรือการดำเนินการทางคลินิกสำหรับแต่ละบุคคล
Sub-topics
Core questions
- ข้อมูลใดที่ตอบคำถามการส่งต่อ และวิธีการใดที่ให้ข้อมูลนั้นได้อย่างน่าเชื่อถือ?
- ความน่าเชื่อถือและความถูกต้องควบคุมสิ่งที่คะแนนการทดสอบสามารถและไม่สามารถสนับสนุนได้อย่างไร?
- เมื่อใดที่ควรนำการตัดสินใจทางคลินิกมารวมกับการทำนายทางสถิติ (เชิงกล) หรือให้ความสำคัญกับการทำนายทางสถิติ?
- คะแนนถูกตีความอย่างเป็นธรรมอย่างไรในกลุ่มคนที่มีภูมิหลังแตกต่างกัน?
Key concepts
- ความน่าเชื่อถือและข้อผิดพลาดในการวัด
- ความถูกต้อง (เนื้อหา เกณฑ์ โครงสร้าง)
- การสร้างมาตรฐานและบรรทัดฐาน
- คำถามการส่งต่อและการบูรณาการ
- ความเป็นธรรมและอคติของการทดสอบ
- การทำนายทางคลินิกเทียบกับการทำนายเชิงกล (ทางสถิติ)
Key theories
- ความถูกต้องเชิงโครงสร้าง (Construct validity)
- Cronbach และ Meehl โต้แย้งว่าเมื่อการทดสอบวัดคุณลักษณะที่ไม่ได้กำหนดโดยการดำเนินการเดียว หลักฐานสำหรับโครงสร้างที่อนุมานได้จะต้องถูกสะสมผ่านเครือข่ายเชิงกฎหมาย (nomological network) ที่เชื่อมโยงการทดสอบกับตัวแปรที่สังเกตได้อื่น ๆ ซึ่งเป็นการปรับเปลี่ยนการตรวจสอบความถูกต้องเป็นการทดสอบทฤษฎีมากกว่าการหาความสัมพันธ์กับเกณฑ์ง่าย ๆ
Mechanisms
การประเมินจะเริ่มต้นจากคำถามการส่งต่อไปยังการเลือกวิธีการ การรวบรวมการตอบสนองที่ควบคุม การแปลงการตอบสนองเป็นคะแนนเทียบกับบรรทัดฐาน และการบูรณาการแหล่งข้อมูลหลายแหล่งเข้ากับการตีความ ทฤษฎีจิตวิทยาให้การรับรองสำหรับแต่ละขั้นตอน: ความน่าเชื่อถือบ่งชี้ว่าคะแนนส่วนใหญ่เป็นสัญญาณมากกว่าข้อผิดพลาด และความถูกต้อง ซึ่ง Cronbach และ Meehl กำหนดให้เป็นความถูกต้องเชิงโครงสร้าง (construct validity) และ Messick ขยายความว่าเป็นแนวคิดที่รวมเป็นหนึ่งเดียวและอิงตามข้อโต้แย้ง จะควบคุมว่าการอนุมานที่ตั้งใจไว้นั้นสมเหตุสมผลหรือไม่ การเปรียบเทียบแบบอภิมานของการทำนายทางคลินิกและเชิงกลโดย Grove และคณะ แสดงให้เห็นว่าวิธีการรวมข้อมูล ไม่ใช่แค่เพียงวิธีการรวบรวมข้อมูลเท่านั้น ที่ส่งผลต่อความแม่นยำ
Clinical relevance
การประเมินเป็นพื้นฐานของการกำหนดกรณี การจำแนกการวินิจฉัย การวางแผนการรักษา และการติดตามผลลัพธ์ทั่วทั้งจิตวิทยาคลินิก และการประเมินหลักฐานการทดสอบอย่างมีวิจารณญาณเป็นส่วนหนึ่งของการปฏิบัติงานที่มีความสามารถ บทความนี้อธิบายตรรกะและมาตรฐานของการประเมินในฐานะสาขาหนึ่ง; เป็นการให้ความรู้เชิงอ้างอิงและไม่ใช่ระเบียบปฏิบัติสำหรับการเลือก การดำเนินการ หรือการตีความการทดสอบสำหรับบุคคลใดบุคคลหนึ่ง
Evidence & guidelines
มาตรฐานสำหรับการทดสอบทางการศึกษาและจิตวิทยา (The Standards for Educational and Psychological Testing) ซึ่งออกร่วมกันโดย AERA, APA และ NCME เป็นเอกสารอ้างอิงที่เป็นที่ยอมรับสำหรับการพัฒนา การประเมิน และการใช้การทดสอบ และกำหนดความถูกต้อง ความน่าเชื่อถือ และความเป็นธรรมให้เป็นความคาดหวังทางวิชาชีพร่วมกัน คำอธิบายความถูกต้องที่เป็นหนึ่งเดียวของ Messick และการวิเคราะห์อภิมานเกี่ยวกับการทำนายของ Grove และคณะ เป็นหลักยึดทางระเบียบวิธีที่อ้างอิงอย่างกว้างขวางสำหรับสาขานี้
History
การทดสอบทางจิตวิทยาสมัยใหม่เติบโตมาจากการทำงานในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 เกี่ยวกับความแตกต่างระหว่างบุคคลและสติปัญญา และรวมตัวกันเป็นทฤษฎีการทดสอบแบบคลาสสิกตลอดช่วงกลางศตวรรษที่ 20 บทความของ Cronbach และ Meehl ในปี 1955 เรื่องความถูกต้องเชิงโครงสร้างได้ปรับทิศทางของสาขาไปสู่การตรวจสอบความถูกต้องตามทฤษฎี และ Messick ได้รวมแนวคิดเรื่องความถูกต้องในภายหลังโดยเน้นที่การให้เหตุผลของการอนุมานคะแนนและผลที่ตามมา งานก่อนหน้านี้ของ Meehl เกี่ยวกับการทำนายได้จุดประกายการวิจัยจำนวนมาก ซึ่งสรุปโดยการวิเคราะห์อภิมานโดย Grove และคณะ เกี่ยวกับวิธีการเปรียบเทียบวิธีการทางคลินิกและสถิติในการรวมข้อมูล
Debates
- การทำนายทางคลินิกเทียบกับการทำนายเชิงกล
- คำถามที่ยังคงอยู่คือการตัดสินใจเชิงบูรณาการของนักคลินิกมีประสิทธิภาพเหนือกว่ากฎทางสถิติแบบง่ายหรือไม่ หลักฐานจากการวิเคราะห์อภิมานโดยทั่วไปสนับสนุนการรวมข้อมูลเชิงกลแบบเดียวกัน ในขณะที่การถกเถียงยังคงดำเนินต่อไปเกี่ยวกับขอบเขต คุณภาพข้อมูล และบทบาทของการตัดสินใจของผู้เชี่ยวชาญในการเลือกตัวทำนาย
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
Related topics
Seminal works
- cronbach-meehl-1955
- messick-1995
- grove-2000
Frequently asked questions
- การประเมินกับการทดสอบแตกต่างกันอย่างไร?
- การทดสอบคือการใช้เครื่องมือมาตรฐานและได้มาซึ่งคะแนน; การประเมินคือกระบวนการที่กว้างกว่าในการรวบรวมและบูรณาการข้อมูลจากการทดสอบ การสัมภาษณ์ การสังเกต และบันทึก เพื่อตอบคำถามการส่งต่อ
- เหตุใดความน่าเชื่อถือและความถูกต้องจึงมีความสำคัญมากในสาขานี้?
- ความน่าเชื่อถือกำหนดเพดานว่าคะแนนจะน่าเชื่อถือได้มากน้อยเพียงใด และความถูกต้องกำหนดว่าการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่ หากไม่มีทั้งสองอย่าง การตีความก็ไม่สามารถปกป้องได้