การประเมินทางการศึกษาและผลลัพธ์การเรียนรู้
การประเมินทางการศึกษาคือกระบวนการรวบรวมและตีความหลักฐานเกี่ยวกับสิ่งที่ผู้เรียนรู้และสามารถทำได้ โดยเทียบกับผลลัพธ์การเรียนรู้ที่กำหนดไว้ การประเมินนี้แยกแยะระหว่างการประเมินที่สนับสนุนการเรียนรู้ (แบบเสริมสร้าง) กับการประเมินที่รับรองความสำเร็จ (แบบสรุปผล) และถูกตัดสินด้วยคุณสมบัติเช่น ความตรง ความน่าเชื่อถือ และผลกระทบทางการศึกษา
Definition
การประเมินทางการศึกษาคือการรวบรวมและตีความหลักฐานการเรียนรู้อย่างเป็นระบบ โดยเทียบกับผลลัพธ์ที่ตั้งใจไว้ ซึ่งใช้เพื่อสนับสนุนการเรียนรู้เพิ่มเติม (แบบเสริมสร้าง) หรือเพื่อตัดสินใจเกี่ยวกับความสำเร็จและความก้าวหน้า (แบบสรุปผล) ส่วนผลลัพธ์การเรียนรู้คือข้อความที่ระบุว่าผู้เรียนควรจะสามารถทำอะไรได้บ้าง ซึ่งการประเมินถูกออกแบบมาเพื่อวัดสิ่งเหล่านั้น
Scope
หัวข้อนี้ครอบคลุมวัตถุประสงค์และคุณภาพของการประเมินในการศึกษาด้านสุขภาพ กรอบแนวคิดสำหรับการประเมิน สิ่งที่ต้องประเมิน ความแตกต่างระหว่างการประเมินแบบเสริมสร้างและการประเมินแบบสรุปผล และแนวคิดที่เกี่ยวข้องกับการประเมินโครงการ โดยถือว่าการประเมินเป็นหัวข้อทางระเบียบวิธีวิจัย และไม่ใช่คู่มือสำหรับการให้คะแนนหรือการสอบรายวิชาใดโดยเฉพาะ
Core questions
- วัตถุประสงค์ของการประเมินที่กำหนดคืออะไร — เพื่อสนับสนุนการเรียนรู้หรือเพื่อรับรองความสำเร็จ?
- การประเมินนี้มุ่งเป้าไปที่ระดับความสามารถใด?
- อะไรที่ทำให้การประเมินมีความตรง น่าเชื่อถือ และสามารถป้องกันได้?
- การประเมินแต่ละรายการรวมกันเป็นโปรแกรมที่สอดคล้องกันได้อย่างไร?
Key concepts
- การประเมินแบบเสริมสร้างและการประเมินแบบสรุปผล
- ความตรงและความน่าเชื่อถือ
- ผลลัพธ์และวัตถุประสงค์การเรียนรู้
- พีระมิดความสามารถของมิลเลอร์
- การประเมินตามสถานที่ทำงาน
- การประเมินเชิงโปรแกรม
- การประเมินโครงการ
Key theories
- พีระมิดของมิลเลอร์
- กรอบแนวคิดที่อธิบายระดับการประเมินทางคลินิกสี่ระดับที่เพิ่มขึ้น — รู้, รู้วิธี, แสดงวิธี, และทำได้จริง — ใช้เพื่อจับคู่วิธีการประเมินกับระดับความสามารถที่กำลังถูกตัดสิน
- การประเมินเชิงโปรแกรม
- แนวทางที่ถือว่าการประเมินแต่ละรายการเป็นจุดข้อมูลที่รวมกันอย่างจงใจตลอดช่วงเวลา เพื่อเพิ่มประสิทธิภาพของโปรแกรมทั้งหมดสำหรับการเรียนรู้และการตัดสินใจ แทนที่จะพึ่งพาการทดสอบที่มีความสำคัญสูงที่แยกต่างหาก
- ประโยชน์ใช้สอยของการประเมิน
- มุมมองที่ว่าคุณค่าของการประเมินเป็นผลผลิตของคุณสมบัติหลายประการ — ความตรง ความน่าเชื่อถือ ผลกระทบทางการศึกษา การยอมรับได้ และต้นทุน — ซึ่งต้องได้รับการถ่วงดุลแทนที่จะเพิ่มให้สูงสุดทีละอย่าง
Mechanisms
การประเมินถูกออกแบบโดยการจับคู่วิธีการให้เข้ากับวัตถุประสงค์และระดับความสามารถที่กำลังถูกตัดสิน พีระมิดของมิลเลอร์ (Miller, 1990) จัดลำดับวิธีการตั้งแต่การทดสอบความรู้ (รู้, รู้วิธี) ไปจนถึงการสังเกตการปฏิบัติงาน (แสดงวิธี, ทำได้จริง) ดังนั้น ตัวอย่างเช่น การทดสอบข้อเขียนจึงเหมาะสำหรับระดับที่ต่ำกว่า และการสังเกตในสถานที่ทำงานเหมาะสำหรับระดับที่สูงกว่า จากนั้นวิธีการที่เลือกจะถูกประเมินเพื่อหาประโยชน์ใช้สอย — ความตรง ความน่าเชื่อถือ ผลกระทบต่อการเรียนรู้ การยอมรับได้ และต้นทุน — และนำมารวมกัน ในแนวทางเชิงโปรแกรม ให้เป็นลำดับของข้อมูลที่มีความสำคัญต่ำและสูงอย่างจงใจ ซึ่งทั้งหมดนี้สนับสนุนทั้งการเรียนรู้และการตัดสินใจที่แข็งแกร่ง (Epstein, 2007; Van der Vleuten et al., 2012) การประเมินโครงการขยายตรรกะเดียวกันนี้ไปสู่การตัดสินโปรแกรมการศึกษาเอง (Frye & Hemmer, 2012)
Clinical relevance
การประเมินกำหนดสิ่งที่ผู้เรียนศึกษาและวิธีที่นักการศึกษาตัดสินความสามารถ ดังนั้นการทำความเข้าใจหลักการของการประเมินจึงสนับสนุนการออกแบบและการวิพากษ์วิจารณ์การประเมินที่เป็นธรรมและสามารถป้องกันได้ในการศึกษาด้านสุขภาพ หัวข้อนี้อธิบายวิธีการวัดการเรียนรู้และไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล
Evidence & guidelines
การปฏิบัติการประเมินในวิชาชีพสุขภาพได้รับคำแนะนำจากกรอบแนวคิดที่อ้างอิงอย่างกว้างขวาง — พีระมิดของมิลเลอร์สำหรับการจับคู่วิธีการกับความสามารถ (Miller, 1990) แนวคิดเรื่องประโยชน์ใช้สอยและการทบทวนวิธีการประเมิน (Epstein, 2007) และการประเมินเชิงโปรแกรมสำหรับการรวมหลักฐานตลอดช่วงเวลา (Van der Vleuten et al., 2012) การประเมินโครงการอาศัยแบบจำลองที่ได้รับการยอมรับ เช่นที่สรุปโดย Frye และ Hemmer (2012) หลักฐานส่วนใหญ่เหล่านี้เป็นแนวคิดและอิงตามฉันทามติมากกว่าการทดลอง
History
การประเมินในวิชาชีพสุขภาพมีการเปลี่ยนแปลงในช่วงปลายศตวรรษที่ 20 จากการมุ่งเน้นการทดสอบความรู้ไปสู่การสังเกตการปฏิบัติงานโดยตรง ซึ่งถูกทำให้ชัดเจนด้วยพีระมิดของมิลเลอร์ในปี 1990 ทศวรรษต่อมาเน้นย้ำถึงประโยชน์ใช้สอยหลายมิติของการประเมิน วิธีการที่อิงตามสถานที่ทำงาน และ — ล่าสุด — แนวทางเชิงโปรแกรมที่รวมการประเมินหลายอย่างเข้าด้วยกันตลอดช่วงเวลา แทนที่จะพึ่งพาการสอบที่มีความสำคัญสูงเพียงครั้งเดียว
Debates
- ความตรงและความน่าเชื่อถือสามารถเพิ่มให้สูงสุดได้พร้อมกันหรือไม่?
- การประเมินที่แท้จริงและอิงตามการปฏิบัติงานมักจะได้รับความตรงโดยมีค่าใช้จ่ายบางส่วนต่อการสร้างมาตรฐานและความน่าเชื่อถือ ดังนั้นผู้ออกแบบจึงต้องถ่วงดุลคุณสมบัติของการประเมินแทนที่จะเพิ่มให้สูงสุดเพียงอย่างเดียว ซึ่งเป็นความตึงเครียดที่เป็นหัวใจสำคัญของแนวคิดเรื่องประโยชน์ใช้สอยและแนวทางเชิงโปรแกรม
Key figures
- George Miller
- Cees van der Vleuten
- Ronald Epstein
- Lambert Schuwirth
Related topics
Seminal works
- miller-1990
- epstein-2007
- vandervleuten-2012
Frequently asked questions
- ความแตกต่างระหว่างการประเมินแบบเสริมสร้างและการประเมินแบบสรุปผลคืออะไร?
- การประเมินแบบเสริมสร้างมีวัตถุประสงค์เพื่อสนับสนุนและชี้นำการเรียนรู้เพิ่มเติมผ่านข้อเสนอแนะ ในขณะที่การประเมินแบบสรุปผลใช้เพื่อรับรองความสำเร็จและตัดสินใจ เช่น การผ่านหรือไม่ผ่าน หรือความก้าวหน้า
- พีระมิดของมิลเลอร์อธิบายอะไร?
- มันอธิบายระดับความสามารถทางคลินิกสี่ระดับ — รู้, รู้วิธี, แสดงวิธี, และทำได้จริง — และช่วยจับคู่วิธีการประเมินกับระดับความสามารถที่กำลังถูกประเมิน