教育评估与学习成果
教育评估是根据既定的学习成果,收集和解释有关学习者已知和能做到的证据的过程。它区分了支持学习的评估(形成性评估)和认证成就的评估(总结性评估),并通过有效性、可靠性和教育影响等品质进行评判。
Definition
教育评估是根据预期成果系统地收集和解释学习证据的过程,用于支持进一步学习(形成性)或对成就和进展做出决策(总结性);学习成果是评估旨在衡量的、学习者应该能够做到的陈述。
Scope
本主题涵盖了健康教育中评估的目的和品质、评估内容的框架、形成性评估和总结性评估之间的对比,以及相关的项目评估理念。它将评估视为一种方法学主题,而非任何特定课程的评分或考试指南。
Core questions
- 特定评估的目的是什么——支持学习还是认证学习?
- 评估旨在衡量哪个能力水平?
- 什么使评估有效、可靠和有依据?
- 个体评估如何组合成一个连贯的程序?
Key concepts
- 形成性评估和总结性评估
- 有效性和可靠性
- 学习成果和目标
- 米勒能力金字塔
- 基于工作场所的评估
- 程序性评估
- 项目评估
Key theories
- 米勒金字塔
- 一个描述临床评估四个递进层次的框架——知道、知道如何、展示如何、做到——用于将评估方法与所判断的能力水平相匹配。
- 程序性评估
- 一种将个体评估视为随时间有意组合的数据点的方法,优化整个项目以实现学习和决策,而非依赖孤立的高风险测试。
- 评估的效用
- 一种观点,认为评估的价值是多种品质的产物——有效性、可靠性、教育影响、可接受性和成本——这些品质必须平衡而非单独最大化。
Mechanisms
评估的设计是通过将方法与目的以及所判断的能力水平相匹配。米勒金字塔(Miller, 1990)将方法从测试知识(知道、知道如何)到观察表现(展示如何、做到)进行排序,例如,笔试适用于较低水平,而工作场所观察适用于较高水平。然后,对所选方法进行效用评估——有效性、可靠性、对学习的影响、可接受性和成本——并在程序性方法中,将它们组合成一个由低风险和高风险数据点组成的有意序列,共同支持学习和稳健的决策(Epstein, 2007; Van der Vleuten et al., 2012)。项目评估将相同的逻辑扩展到评估教育项目本身(Frye & Hemmer, 2012)。
Clinical relevance
评估塑造了学习者学习的内容以及教育者判断能力的方式,因此理解其原则有助于设计和批判健康教育中公平、有依据的评估。本主题描述了如何衡量学习,而非个体临床决策的基础。
Evidence & guidelines
健康专业领域的评估实践受到广泛引用的框架指导——用于将方法与能力相匹配的米勒金字塔(Miller, 1990)、效用概念和评估方法综述(Epstein, 2007),以及用于随时间整合证据的程序性评估(Van der Vleuten et al., 2012)。项目评估借鉴了 Frye 和 Hemmer (2012) 总结的既定模型。这些证据大多是概念性和基于共识的,而非实验性的。
History
20世纪后期,健康专业领域的评估从侧重知识测试转向直接观察表现,米勒1990年的金字塔对此进行了明确阐述。随后的几十年强调了评估的多维度效用、基于工作场所的方法,以及——最近——整合了许多随时间进行的评估而非依赖单一高风险考试的程序性方法。
Debates
- 有效性和可靠性能否同时最大化?
- 真实的、基于表现的评估通常会以牺牲标准化和可靠性为代价来提高有效性,因此设计者必须平衡评估的品质,而非优化任何一个,这是效用概念和程序性方法的核心张力。
Key figures
- George Miller
- Cees van der Vleuten
- Ronald Epstein
- Lambert Schuwirth
Related topics
Seminal works
- miller-1990
- epstein-2007
- vandervleuten-2012
Frequently asked questions
- 形成性评估和总结性评估有什么区别?
- 形成性评估旨在通过反馈支持和指导进一步学习,而总结性评估则用于认证成就并做出通过或晋升等决定。
- 米勒金字塔描述了什么?
- 它描述了临床能力的四个层次——知道、知道如何、展示如何、做到——并有助于将评估方法与所评估的能力水平相匹配。