Стандартизированное тестирование и нормативно-ориентированная оценка
Стандартизированное тестирование и нормативно-ориентированная оценка — это использование формальных инструментов, которые проводятся и оцениваются в фиксированных условиях, так что результаты отдельного человека могут быть сопоставлены с распределением баллов, полученных от репрезентативной референтной (нормативной) выборки. В логопедии эти инструменты дают стандартные баллы, процентильные ранги и возрастные эквиваленты, используемые для обоснования решений о праве на получение услуг, степени тяжести и диагностических решений.
Definition
Нормативно-ориентированный тест — это измерение, проводимое и оцениваемое в стандартизированных условиях и интерпретируемое путем сравнения «сырого» балла индивида с распределением баллов из определенной нормативной выборки, обычно выражаемое в виде стандартных баллов или процентильных рангов.
Scope
Эта тема охватывает логику нормативно-ориентированного измерения, значение стандартизации, психометрические свойства (надежность, валидность, адекватность норм), которые определяют достоверность теста, а также интерпретацию и ограничения критериев отсечения. Она рассматривает стандартизированное тестирование как один из видов оценки в логопедии и как методологический предмет, а не как инструкции по тестированию отдельного человека.
Core questions
- Что на самом деле говорит нам стандартный балл об индивиде относительно сверстников?
- Насколько адекватными должны быть нормативная выборка, надежность и валидность теста, прежде чем его баллы смогут служить руководством для диагностики?
- Где следует установить диагностический порог, и как этот выбор влияет на чувствительность и специфичность?
- Когда нормативно-ориентированное тестирование является неподходящим инструментом, и что должно его дополнять?
Key concepts
- Стандартизация проведения и подсчета баллов
- Нормативная (референтная) выборка
- Стандартный балл, процентильный ранг, возрастной эквивалент
- Надежность (тест-ретестовая, внутренняя согласованность)
- Валидность (конструктная, содержательная, критериальная)
- Чувствительность, специфичность и диагностические пороги
- Стандартная ошибка измерения
- Нормативно-ориентированная против критериально-ориентированной интерпретации
Mechanisms
Тест стандартизируется путем фиксации заданий, процедуры проведения и правил подсчета баллов, а затем проводится на нормативной выборке, выбранной для представления интересующей популяции. «Сырой» балл индивида преобразуется, используя распределение этой выборки, в стандартный балл или процентиль, который определяет положение человека относительно сверстников. Интерпретационная ценность этой позиции зависит от надежности теста (последовательности измерения), его валидности (измеряет ли он предполагаемый конструкт) и репрезентативности норм. Диагностическое использование добавляет правило принятия решения: пороговое значение, ниже которого результаты считаются нарушенными, чье расположение регулирует компромисс между чувствительностью и специфичностью (Spaulding, Plante, & Farinella, 2006).
Clinical relevance
Нормативно-ориентированные баллы часто определяют право на получение услуг и задокументированную степень тяжести нарушения коммуникации, поэтому их психометрическое качество имеет прямые последствия для того, кто будет идентифицирован. Эта статья описывает, как такие баллы выводятся и интерпретируются, а также условия, при которых они являются достоверными; это справочная ориентация и не предписывает, как тестировать или диагностировать конкретного человека.
Evidence & guidelines
Методологические обзоры неоднократно показывали, что многие опубликованные тесты языка и артикуляции не соответствуют базовым психометрическим критериям надежности, валидности и адекватности норм, предостерегая от некритического использования их результатов (McCauley & Swisher, 1984). Анализы критериев отбора показывают, что общие пороговые значения (например, результаты на одно или более стандартных отклонений ниже среднего) не всегда последовательно отличают детей с языковыми нарушениями от типично развивающихся сверстников, поскольку тесты различаются по своей диагностической точности (Spaulding et al., 2006). «Стандарты для образовательного и психологического тестирования» (Standards for Educational and Psychological Testing) устанавливают общие ожидания в отношении разработки тестов, доказательств валидности и справедливого использования (AERA, APA, & NCME, 2014).
History
Нормативно-ориентированное тестирование при нарушениях коммуникации быстро развивалось в середине XX века наряду с более широким психометрическим движением, кодифицированным такими фигурами, как Анастази. К 1980-м годам распространение тестов языка и артикуляции вызвало систематическую психометрическую проверку (McCauley & Swisher, 1984), а последующая работа сместила акцент с удобных пороговых значений на задокументированную диагностическую точность и интеграцию стандартизированных баллов с другими данными оценки (Spaulding et al., 2006).
Debates
- Достаточно ли результатов ниже общепринятого порогового значения для диагностики нарушения?
- Диагностические пороговые значения, такие как -1 или -1,25 стандартных отклонений, широко используются, но их чувствительность и специфичность варьируются в разных тестах; опора на единый общепринятый порог может как завышать, так и занижать количество выявленных детей, поэтому пороговое значение должно быть обосновано измеренной диагностической точностью теста.
- Насколько хорошо нормативные выборки представляют разнообразные популяции?
- Когда нормативная выборка не представляет языковой или культурный фон человека, стандартные баллы могут искажать способности, поднимая давние вопросы о справедливом использовании нормативно-ориентированных тестов в различных популяциях.
Key figures
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
Related topics
Seminal works
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Frequently asked questions
- В чем разница между нормативно-ориентированной и критериально-ориентированной оценкой?
- Нормативно-ориентированная оценка сравнивает балл человека с распределением референтной выборки, чтобы показать относительное положение, тогда как критериально-ориентированная оценка сравнивает результаты с определенным навыком или стандартом независимо от того, как справляются сверстники.
- Почему важна стандартная ошибка измерения?
- Поскольку ни один тест не является абсолютно надежным, полученный балл является оценкой; стандартная ошибка измерения количественно определяет его неопределенность, и именно поэтому баллы лучше интерпретировать как доверительные интервалы, а не как точные точки, особенно вблизи диагностического порога.