พีระมิดของมิลเลอร์อธิบายอะไร?

มันอธิบายระดับความสามารถทางคลินิกสี่ระดับ — รู้, รู้วิธี, แสดงวิธี, และทำได้จริง — และช่วยจับคู่วิธีการประเมินกับระดับความสามารถที่กำลังถูกประเมิน

การประเมินทางการศึกษาและผลลัพธ์การเรียนรู้

การประเมินทางการศึกษาคือกระบวนการรวบรวมและตีความหลักฐานเกี่ยวกับสิ่งที่ผู้เรียนรู้และสามารถทำได้ โดยเทียบกับผลลัพธ์การเรียนรู้ที่กำหนดไว้ การประเมินนี้แยกแยะระหว่างการประเมินที่สนับสนุนการเรียนรู้ (แบบเสริมสร้าง) กับการประเมินที่รับรองความสำเร็จ (แบบสรุปผล) และถูกตัดสินด้วยคุณสมบัติเช่น ความตรง ความน่าเชื่อถือ และผลกระทบทางการศึกษา

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics

Tools & resources

ดาวน์โหลดสไลด์

Learn & explore

วิดีโอเร็ว ๆ นี้

Definition

การประเมินทางการศึกษาคือการรวบรวมและตีความหลักฐานการเรียนรู้อย่างเป็นระบบ โดยเทียบกับผลลัพธ์ที่ตั้งใจไว้ ซึ่งใช้เพื่อสนับสนุนการเรียนรู้เพิ่มเติม (แบบเสริมสร้าง) หรือเพื่อตัดสินใจเกี่ยวกับความสำเร็จและความก้าวหน้า (แบบสรุปผล) ส่วนผลลัพธ์การเรียนรู้คือข้อความที่ระบุว่าผู้เรียนควรจะสามารถทำอะไรได้บ้าง ซึ่งการประเมินถูกออกแบบมาเพื่อวัดสิ่งเหล่านั้น

Scope

หัวข้อนี้ครอบคลุมวัตถุประสงค์และคุณภาพของการประเมินในการศึกษาด้านสุขภาพ กรอบแนวคิดสำหรับการประเมิน สิ่งที่ต้องประเมิน ความแตกต่างระหว่างการประเมินแบบเสริมสร้างและการประเมินแบบสรุปผล และแนวคิดที่เกี่ยวข้องกับการประเมินโครงการ โดยถือว่าการประเมินเป็นหัวข้อทางระเบียบวิธีวิจัย และไม่ใช่คู่มือสำหรับการให้คะแนนหรือการสอบรายวิชาใดโดยเฉพาะ

Core questions

วัตถุประสงค์ของการประเมินที่กำหนดคืออะไร — เพื่อสนับสนุนการเรียนรู้หรือเพื่อรับรองความสำเร็จ?
การประเมินนี้มุ่งเป้าไปที่ระดับความสามารถใด?
อะไรที่ทำให้การประเมินมีความตรง น่าเชื่อถือ และสามารถป้องกันได้?
การประเมินแต่ละรายการรวมกันเป็นโปรแกรมที่สอดคล้องกันได้อย่างไร?

Key concepts

การประเมินแบบเสริมสร้างและการประเมินแบบสรุปผล
ความตรงและความน่าเชื่อถือ
ผลลัพธ์และวัตถุประสงค์การเรียนรู้
พีระมิดความสามารถของมิลเลอร์
การประเมินตามสถานที่ทำงาน
การประเมินเชิงโปรแกรม
การประเมินโครงการ

Key theories

พีระมิดของมิลเลอร์: กรอบแนวคิดที่อธิบายระดับการประเมินทางคลินิกสี่ระดับที่เพิ่มขึ้น — รู้, รู้วิธี, แสดงวิธี, และทำได้จริง — ใช้เพื่อจับคู่วิธีการประเมินกับระดับความสามารถที่กำลังถูกตัดสิน
การประเมินเชิงโปรแกรม: แนวทางที่ถือว่าการประเมินแต่ละรายการเป็นจุดข้อมูลที่รวมกันอย่างจงใจตลอดช่วงเวลา เพื่อเพิ่มประสิทธิภาพของโปรแกรมทั้งหมดสำหรับการเรียนรู้และการตัดสินใจ แทนที่จะพึ่งพาการทดสอบที่มีความสำคัญสูงที่แยกต่างหาก
ประโยชน์ใช้สอยของการประเมิน: มุมมองที่ว่าคุณค่าของการประเมินเป็นผลผลิตของคุณสมบัติหลายประการ — ความตรง ความน่าเชื่อถือ ผลกระทบทางการศึกษา การยอมรับได้ และต้นทุน — ซึ่งต้องได้รับการถ่วงดุลแทนที่จะเพิ่มให้สูงสุดทีละอย่าง

Mechanisms

การประเมินถูกออกแบบโดยการจับคู่วิธีการให้เข้ากับวัตถุประสงค์และระดับความสามารถที่กำลังถูกตัดสิน พีระมิดของมิลเลอร์ (Miller, 1990) จัดลำดับวิธีการตั้งแต่การทดสอบความรู้ (รู้, รู้วิธี) ไปจนถึงการสังเกตการปฏิบัติงาน (แสดงวิธี, ทำได้จริง) ดังนั้น ตัวอย่างเช่น การทดสอบข้อเขียนจึงเหมาะสำหรับระดับที่ต่ำกว่า และการสังเกตในสถานที่ทำงานเหมาะสำหรับระดับที่สูงกว่า จากนั้นวิธีการที่เลือกจะถูกประเมินเพื่อหาประโยชน์ใช้สอย — ความตรง ความน่าเชื่อถือ ผลกระทบต่อการเรียนรู้ การยอมรับได้ และต้นทุน — และนำมารวมกัน ในแนวทางเชิงโปรแกรม ให้เป็นลำดับของข้อมูลที่มีความสำคัญต่ำและสูงอย่างจงใจ ซึ่งทั้งหมดนี้สนับสนุนทั้งการเรียนรู้และการตัดสินใจที่แข็งแกร่ง (Epstein, 2007; Van der Vleuten et al., 2012) การประเมินโครงการขยายตรรกะเดียวกันนี้ไปสู่การตัดสินโปรแกรมการศึกษาเอง (Frye & Hemmer, 2012)

Clinical relevance

การประเมินกำหนดสิ่งที่ผู้เรียนศึกษาและวิธีที่นักการศึกษาตัดสินความสามารถ ดังนั้นการทำความเข้าใจหลักการของการประเมินจึงสนับสนุนการออกแบบและการวิพากษ์วิจารณ์การประเมินที่เป็นธรรมและสามารถป้องกันได้ในการศึกษาด้านสุขภาพ หัวข้อนี้อธิบายวิธีการวัดการเรียนรู้และไม่ใช่พื้นฐานสำหรับการตัดสินใจทางคลินิกส่วนบุคคล

Evidence & guidelines

การปฏิบัติการประเมินในวิชาชีพสุขภาพได้รับคำแนะนำจากกรอบแนวคิดที่อ้างอิงอย่างกว้างขวาง — พีระมิดของมิลเลอร์สำหรับการจับคู่วิธีการกับความสามารถ (Miller, 1990) แนวคิดเรื่องประโยชน์ใช้สอยและการทบทวนวิธีการประเมิน (Epstein, 2007) และการประเมินเชิงโปรแกรมสำหรับการรวมหลักฐานตลอดช่วงเวลา (Van der Vleuten et al., 2012) การประเมินโครงการอาศัยแบบจำลองที่ได้รับการยอมรับ เช่นที่สรุปโดย Frye และ Hemmer (2012) หลักฐานส่วนใหญ่เหล่านี้เป็นแนวคิดและอิงตามฉันทามติมากกว่าการทดลอง

History

การประเมินในวิชาชีพสุขภาพมีการเปลี่ยนแปลงในช่วงปลายศตวรรษที่ 20 จากการมุ่งเน้นการทดสอบความรู้ไปสู่การสังเกตการปฏิบัติงานโดยตรง ซึ่งถูกทำให้ชัดเจนด้วยพีระมิดของมิลเลอร์ในปี 1990 ทศวรรษต่อมาเน้นย้ำถึงประโยชน์ใช้สอยหลายมิติของการประเมิน วิธีการที่อิงตามสถานที่ทำงาน และ — ล่าสุด — แนวทางเชิงโปรแกรมที่รวมการประเมินหลายอย่างเข้าด้วยกันตลอดช่วงเวลา แทนที่จะพึ่งพาการสอบที่มีความสำคัญสูงเพียงครั้งเดียว

Debates

ความตรงและความน่าเชื่อถือสามารถเพิ่มให้สูงสุดได้พร้อมกันหรือไม่?: การประเมินที่แท้จริงและอิงตามการปฏิบัติงานมักจะได้รับความตรงโดยมีค่าใช้จ่ายบางส่วนต่อการสร้างมาตรฐานและความน่าเชื่อถือ ดังนั้นผู้ออกแบบจึงต้องถ่วงดุลคุณสมบัติของการประเมินแทนที่จะเพิ่มให้สูงสุดเพียงอย่างเดียว ซึ่งเป็นความตึงเครียดที่เป็นหัวใจสำคัญของแนวคิดเรื่องประโยชน์ใช้สอยและแนวทางเชิงโปรแกรม

Key figures

George Miller
Cees van der Vleuten
Ronald Epstein
Lambert Schuwirth

Seminal works

miller-1990
epstein-2007
vandervleuten-2012

Frequently asked questions

ความแตกต่างระหว่างการประเมินแบบเสริมสร้างและการประเมินแบบสรุปผลคืออะไร?: การประเมินแบบเสริมสร้างมีวัตถุประสงค์เพื่อสนับสนุนและชี้นำการเรียนรู้เพิ่มเติมผ่านข้อเสนอแนะ ในขณะที่การประเมินแบบสรุปผลใช้เพื่อรับรองความสำเร็จและตัดสินใจ เช่น การผ่านหรือไม่ผ่าน หรือความก้าวหน้า
พีระมิดของมิลเลอร์อธิบายอะไร?: มันอธิบายระดับความสามารถทางคลินิกสี่ระดับ — รู้, รู้วิธี, แสดงวิธี, และทำได้จริง — และช่วยจับคู่วิธีการประเมินกับระดับความสามารถที่กำลังถูกประเมิน