การประเมินกับการทดสอบแตกต่างกันอย่างไร?

การทดสอบคือการใช้เครื่องมือมาตรฐานและได้มาซึ่งคะแนน; การประเมินคือกระบวนการที่กว้างกว่าในการรวบรวมและบูรณาการข้อมูลจากการทดสอบ การสัมภาษณ์ การสังเกต และบันทึก เพื่อตอบคำถามการส่งต่อ

เหตุใดความน่าเชื่อถือและความถูกต้องจึงมีความสำคัญมากในสาขานี้?

ความน่าเชื่อถือกำหนดเพดานว่าคะแนนจะน่าเชื่อถือได้มากน้อยเพียงใด และความถูกต้องกำหนดว่าการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่ หากไม่มีทั้งสองอย่าง การตีความก็ไม่สามารถปกป้องได้

การประเมินและการทดสอบทางจิตวิทยา

การประเมินและการทดสอบทางจิตวิทยาเป็นสาขาหนึ่งของจิตวิทยาคลินิกที่เกี่ยวข้องกับการรวบรวม การวัด และการบูรณาการข้อมูลเกี่ยวกับความรู้ความเข้าใจ อารมณ์ บุคลิกภาพ และพฤติกรรมของบุคคล เพื่อตอบคำถามการส่งต่อ (referral question) ครอบคลุมถึงการทดสอบมาตรฐาน การสัมภาษณ์แบบมีโครงสร้าง การสังเกต และทฤษฎีการวัดที่ช่วยให้สามารถตีความคะแนนได้อย่างสมเหตุสมผล

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การประเมินทางจิตวิทยาคือกระบวนการที่เป็นระบบในการรวบรวมและบูรณาการข้อมูลเกี่ยวกับบุคคล ซึ่งมักจะผ่านการทดสอบมาตรฐาน การสัมภาษณ์ การสังเกต และบันทึก เพื่ออธิบายการทำงานและตอบคำถามการส่งต่อ; การทดสอบเป็นการกระทำที่แคบกว่าในการใช้เครื่องมือมาตรฐานและได้มาซึ่งคะแนน

Scope

สาขานี้จะแนะนำผู้อ่านให้เข้าใจว่านักจิตวิทยาคลินิกได้รับและตีความข้อมูลเกี่ยวกับบุคคลอย่างไร: พื้นฐานทางจิตวิทยาของการวัด การสัมภาษณ์เพื่อการวินิจฉัย การประเมินความสามารถทางปัญญา การวัดบุคลิกภาพ และการสังเกตโดยตรงและการวิเคราะห์เชิงหน้าที่ของพฤติกรรม โดยถือว่าการประเมินเป็นโดเมนทางระเบียบวิธีและแนวคิด อธิบายถึงวิธีการสร้างและประเมินหลักฐานเกี่ยวกับบุคคล แทนที่จะกำหนดการทดสอบหรือการดำเนินการทางคลินิกสำหรับแต่ละบุคคล

Sub-topics

Core questions

ข้อมูลใดที่ตอบคำถามการส่งต่อ และวิธีการใดที่ให้ข้อมูลนั้นได้อย่างน่าเชื่อถือ?
ความน่าเชื่อถือและความถูกต้องควบคุมสิ่งที่คะแนนการทดสอบสามารถและไม่สามารถสนับสนุนได้อย่างไร?
เมื่อใดที่ควรนำการตัดสินใจทางคลินิกมารวมกับการทำนายทางสถิติ (เชิงกล) หรือให้ความสำคัญกับการทำนายทางสถิติ?
คะแนนถูกตีความอย่างเป็นธรรมอย่างไรในกลุ่มคนที่มีภูมิหลังแตกต่างกัน?

Key concepts

ความน่าเชื่อถือและข้อผิดพลาดในการวัด
ความถูกต้อง (เนื้อหา เกณฑ์ โครงสร้าง)
การสร้างมาตรฐานและบรรทัดฐาน
คำถามการส่งต่อและการบูรณาการ
ความเป็นธรรมและอคติของการทดสอบ
การทำนายทางคลินิกเทียบกับการทำนายเชิงกล (ทางสถิติ)

Key theories

ความถูกต้องเชิงโครงสร้าง (Construct validity): Cronbach และ Meehl โต้แย้งว่าเมื่อการทดสอบวัดคุณลักษณะที่ไม่ได้กำหนดโดยการดำเนินการเดียว หลักฐานสำหรับโครงสร้างที่อนุมานได้จะต้องถูกสะสมผ่านเครือข่ายเชิงกฎหมาย (nomological network) ที่เชื่อมโยงการทดสอบกับตัวแปรที่สังเกตได้อื่น ๆ ซึ่งเป็นการปรับเปลี่ยนการตรวจสอบความถูกต้องเป็นการทดสอบทฤษฎีมากกว่าการหาความสัมพันธ์กับเกณฑ์ง่าย ๆ

Mechanisms

การประเมินจะเริ่มต้นจากคำถามการส่งต่อไปยังการเลือกวิธีการ การรวบรวมการตอบสนองที่ควบคุม การแปลงการตอบสนองเป็นคะแนนเทียบกับบรรทัดฐาน และการบูรณาการแหล่งข้อมูลหลายแหล่งเข้ากับการตีความ ทฤษฎีจิตวิทยาให้การรับรองสำหรับแต่ละขั้นตอน: ความน่าเชื่อถือบ่งชี้ว่าคะแนนส่วนใหญ่เป็นสัญญาณมากกว่าข้อผิดพลาด และความถูกต้อง ซึ่ง Cronbach และ Meehl กำหนดให้เป็นความถูกต้องเชิงโครงสร้าง (construct validity) และ Messick ขยายความว่าเป็นแนวคิดที่รวมเป็นหนึ่งเดียวและอิงตามข้อโต้แย้ง จะควบคุมว่าการอนุมานที่ตั้งใจไว้นั้นสมเหตุสมผลหรือไม่ การเปรียบเทียบแบบอภิมานของการทำนายทางคลินิกและเชิงกลโดย Grove และคณะ แสดงให้เห็นว่าวิธีการรวมข้อมูล ไม่ใช่แค่เพียงวิธีการรวบรวมข้อมูลเท่านั้น ที่ส่งผลต่อความแม่นยำ

Clinical relevance

การประเมินเป็นพื้นฐานของการกำหนดกรณี การจำแนกการวินิจฉัย การวางแผนการรักษา และการติดตามผลลัพธ์ทั่วทั้งจิตวิทยาคลินิก และการประเมินหลักฐานการทดสอบอย่างมีวิจารณญาณเป็นส่วนหนึ่งของการปฏิบัติงานที่มีความสามารถ บทความนี้อธิบายตรรกะและมาตรฐานของการประเมินในฐานะสาขาหนึ่ง; เป็นการให้ความรู้เชิงอ้างอิงและไม่ใช่ระเบียบปฏิบัติสำหรับการเลือก การดำเนินการ หรือการตีความการทดสอบสำหรับบุคคลใดบุคคลหนึ่ง

Evidence & guidelines

มาตรฐานสำหรับการทดสอบทางการศึกษาและจิตวิทยา (The Standards for Educational and Psychological Testing) ซึ่งออกร่วมกันโดย AERA, APA และ NCME เป็นเอกสารอ้างอิงที่เป็นที่ยอมรับสำหรับการพัฒนา การประเมิน และการใช้การทดสอบ และกำหนดความถูกต้อง ความน่าเชื่อถือ และความเป็นธรรมให้เป็นความคาดหวังทางวิชาชีพร่วมกัน คำอธิบายความถูกต้องที่เป็นหนึ่งเดียวของ Messick และการวิเคราะห์อภิมานเกี่ยวกับการทำนายของ Grove และคณะ เป็นหลักยึดทางระเบียบวิธีที่อ้างอิงอย่างกว้างขวางสำหรับสาขานี้

History

การทดสอบทางจิตวิทยาสมัยใหม่เติบโตมาจากการทำงานในช่วงปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 เกี่ยวกับความแตกต่างระหว่างบุคคลและสติปัญญา และรวมตัวกันเป็นทฤษฎีการทดสอบแบบคลาสสิกตลอดช่วงกลางศตวรรษที่ 20 บทความของ Cronbach และ Meehl ในปี 1955 เรื่องความถูกต้องเชิงโครงสร้างได้ปรับทิศทางของสาขาไปสู่การตรวจสอบความถูกต้องตามทฤษฎี และ Messick ได้รวมแนวคิดเรื่องความถูกต้องในภายหลังโดยเน้นที่การให้เหตุผลของการอนุมานคะแนนและผลที่ตามมา งานก่อนหน้านี้ของ Meehl เกี่ยวกับการทำนายได้จุดประกายการวิจัยจำนวนมาก ซึ่งสรุปโดยการวิเคราะห์อภิมานโดย Grove และคณะ เกี่ยวกับวิธีการเปรียบเทียบวิธีการทางคลินิกและสถิติในการรวมข้อมูล

Debates

การทำนายทางคลินิกเทียบกับการทำนายเชิงกล: คำถามที่ยังคงอยู่คือการตัดสินใจเชิงบูรณาการของนักคลินิกมีประสิทธิภาพเหนือกว่ากฎทางสถิติแบบง่ายหรือไม่ หลักฐานจากการวิเคราะห์อภิมานโดยทั่วไปสนับสนุนการรวมข้อมูลเชิงกลแบบเดียวกัน ในขณะที่การถกเถียงยังคงดำเนินต่อไปเกี่ยวกับขอบเขต คุณภาพข้อมูล และบทบาทของการตัดสินใจของผู้เชี่ยวชาญในการเลือกตัวทำนาย

Key figures

Lee Cronbach
Paul Meehl
Samuel Messick

Seminal works

cronbach-meehl-1955
messick-1995
grove-2000

Frequently asked questions

การประเมินกับการทดสอบแตกต่างกันอย่างไร?: การทดสอบคือการใช้เครื่องมือมาตรฐานและได้มาซึ่งคะแนน; การประเมินคือกระบวนการที่กว้างกว่าในการรวบรวมและบูรณาการข้อมูลจากการทดสอบ การสัมภาษณ์ การสังเกต และบันทึก เพื่อตอบคำถามการส่งต่อ
เหตุใดความน่าเชื่อถือและความถูกต้องจึงมีความสำคัญมากในสาขานี้?: ความน่าเชื่อถือกำหนดเพดานว่าคะแนนจะน่าเชื่อถือได้มากน้อยเพียงใด และความถูกต้องกำหนดว่าการอนุมานที่ได้จากคะแนนนั้นสมเหตุสมผลหรือไม่ หากไม่มีทั้งสองอย่าง การตีความก็ไม่สามารถปกป้องได้