Evaluación Educativa y Resultados de Aprendizaje
La evaluación educativa es el proceso de recopilar e interpretar evidencia sobre lo que los estudiantes saben y pueden hacer, en relación con los resultados de aprendizaje definidos. Distingue la evaluación que apoya el aprendizaje (formativa) de la evaluación que certifica el logro (sumativa), y se juzga por cualidades como la validez, la fiabilidad y el impacto educativo.
Definition
La evaluación educativa es la recopilación e interpretación sistemática de evidencia de aprendizaje en relación con los resultados previstos, utilizada para apoyar el aprendizaje posterior (formativa) o para tomar decisiones sobre el logro y la progresión (sumativa); los resultados de aprendizaje son las declaraciones de lo que los estudiantes deberían ser capaces de hacer y que la evaluación está diseñada para medir.
Scope
Este tema abarca los propósitos y las cualidades de la evaluación en la educación para la salud, los marcos para lo que se debe evaluar, el contraste entre la evaluación formativa y sumativa, y la idea relacionada de evaluación de programas. Trata la evaluación como un tema metodológico y no es una guía para calificar o examinar ningún curso específico.
Core questions
- ¿Cuál es el propósito de una evaluación dada: apoyar el aprendizaje o certificarlo?
- ¿Qué nivel de competencia aborda una evaluación?
- ¿Qué hace que una evaluación sea válida, fiable y defendible?
- ¿Cómo se combinan las evaluaciones individuales en un programa coherente?
Key concepts
- Evaluación formativa y sumativa
- Validez y fiabilidad
- Resultados y objetivos de aprendizaje
- Pirámide de competencia de Miller
- Evaluación basada en el lugar de trabajo
- Evaluación programática
- Evaluación de programas
Key theories
- Pirámide de Miller
- Un marco que describe cuatro niveles ascendentes de evaluación clínica —sabe, sabe cómo, muestra cómo y hace— utilizado para hacer coincidir los métodos de evaluación con el nivel de competencia que se juzga.
- Evaluación programática
- Un enfoque que trata las evaluaciones individuales como puntos de datos combinados deliberadamente a lo largo del tiempo, optimizando el programa completo tanto para el aprendizaje como para la toma de decisiones, en lugar de depender de pruebas aisladas de alto riesgo.
- Utilidad de la evaluación
- La perspectiva de que el valor de una evaluación es producto de varias cualidades —validez, fiabilidad, impacto educativo, aceptabilidad y costo— que deben equilibrarse en lugar de maximizarse individualmente.
Mechanisms
La evaluación se diseña haciendo coincidir el método con el propósito y con el nivel de competencia que se juzga. La pirámide de Miller (Miller, 1990) ordena los métodos desde la evaluación del conocimiento (sabe, sabe cómo) hasta la observación del desempeño (muestra cómo, hace), de modo que, por ejemplo, las pruebas escritas se adecuan a niveles inferiores y la observación en el lugar de trabajo a niveles superiores. Los métodos elegidos se evalúan luego por su utilidad —validez, fiabilidad, impacto en el aprendizaje, aceptabilidad y costo— y se combinan, en enfoques programáticos, en una secuencia deliberada de puntos de datos de bajo y alto riesgo que, en conjunto, apoyan tanto el aprendizaje como las decisiones sólidas (Epstein, 2007; Van der Vleuten et al., 2012). La evaluación de programas extiende la misma lógica para juzgar el programa educativo en sí (Frye & Hemmer, 2012).
Clinical relevance
La evaluación moldea lo que los estudiantes estudian y cómo los educadores juzgan la competencia, por lo que comprender sus principios apoya el diseño y la crítica de una evaluación justa y defendible en la educación para la salud. El tema describe cómo se mide el aprendizaje y no es una base para decisiones clínicas individuales.
Evidence & guidelines
La práctica de la evaluación en las profesiones de la salud se guía por marcos ampliamente citados: la pirámide de Miller para hacer coincidir los métodos con la competencia (Miller, 1990), el concepto de utilidad y las revisiones de los métodos de evaluación (Epstein, 2007), y la evaluación programática para combinar la evidencia a lo largo del tiempo (Van der Vleuten et al., 2012). La evaluación de programas se basa en modelos establecidos como los resumidos por Frye y Hemmer (2012). Gran parte de esta evidencia es conceptual y basada en el consenso, más que experimental.
History
La evaluación en las profesiones de la salud cambió a finales del siglo XX, pasando de un enfoque en la evaluación del conocimiento a la observación directa del desempeño, cristalizada por la pirámide de Miller de 1990. Las décadas posteriores enfatizaron la utilidad multidimensional de la evaluación, los métodos basados en el lugar de trabajo y, más recientemente, los enfoques programáticos que integran muchas evaluaciones a lo largo del tiempo en lugar de depender de exámenes únicos de alto riesgo.
Debates
- ¿Se pueden maximizar la validez y la fiabilidad al mismo tiempo?
- Las evaluaciones auténticas y basadas en el desempeño a menudo ganan validez a costa de la estandarización y la fiabilidad, por lo que los diseñadores deben equilibrar las cualidades de una evaluación en lugar de optimizar una sola, una tensión central en el concepto de utilidad y los enfoques programáticos.
Key figures
- George Miller
- Cees van der Vleuten
- Ronald Epstein
- Lambert Schuwirth
Related topics
Seminal works
- miller-1990
- epstein-2007
- vandervleuten-2012
Frequently asked questions
- ¿Cuál es la diferencia entre evaluación formativa y sumativa?
- La evaluación formativa tiene como objetivo apoyar y guiar el aprendizaje posterior a través de la retroalimentación, mientras que la evaluación sumativa se utiliza para certificar el logro y tomar decisiones como la aprobación o la progresión.
- ¿Qué describe la pirámide de Miller?
- Describe cuatro niveles de competencia clínica —sabe, sabe cómo, muestra cómo y hace— y ayuda a hacer coincidir el método de evaluación con el nivel de competencia que se está evaluando.