آزمون استانداردشده و ارزیابی هنجار-مرجع
آزمون استانداردشده و ارزیابی هنجار-مرجع به استفاده از ابزارهای رسمی اطلاق میشود که تحت شرایط ثابت اجرا و نمرهگذاری میشوند، به طوری که عملکرد یک فرد میتواند با توزیع نمرات به دست آمده از یک نمونه مرجع (هنجاری) نماینده مقایسه شود. در آسیبشناسی گفتار-زبان، این ابزارها نمرات استاندارد، رتبههای درصدی و معادلهای سنی را ارائه میدهند که برای حمایت از تصمیمات مربوط به صلاحیت، شدت و تشخیص استفاده میشوند.
Definition
آزمون هنجار-مرجع یک مقیاس است که تحت شرایط استانداردشده اجرا و نمرهگذاری میشود و با مقایسه نمره خام یک فرد با توزیع نمرات یک نمونه هنجاری تعریفشده، که معمولاً به صورت نمرات استاندارد یا رتبههای درصدی بیان میشود، تفسیر میگردد.
Scope
این موضوع به منطق اندازهگیری هنجار-مرجع، معنای استانداردسازی، ویژگیهای روانسنجی (پایایی، روایی، کفایت هنجاری) که قابلیت اعتماد یک آزمون را تعیین میکنند، و تفسیر و محدودیتهای معیارهای برش میپردازد. این موضوع آزمون استانداردشده را به عنوان یکی از روشهای ارزیابی در آسیبشناسی گفتار-زبان و به عنوان یک موضوع روششناختی در نظر میگیرد، نه به عنوان دستورالعملهایی برای آزمون یک فرد.
Core questions
- یک نمره استاندارد واقعاً چه چیزی را در مورد یک فرد نسبت به همسالانش به ما میگوید؟
- نمونه هنجاری، پایایی و روایی یک آزمون تا چه حد باید کافی باشد تا نمرات آن بتواند راهنمای تشخیص باشد؟
- نقطه برش تشخیصی کجا باید تعیین شود و این انتخاب چگونه بر حساسیت و ویژگی تأثیر میگذارد؟
- چه زمانی آزمون هنجار-مرجع ابزار اشتباهی است و چه چیزی باید آن را تکمیل کند؟
Key concepts
- استانداردسازی اجرا و نمرهگذاری
- نمونه هنجاری (مرجع)
- نمره استاندارد، رتبه درصدی، معادل سنی
- پایایی (آزمون-بازآزمون، همسانی درونی)
- روایی (سازه، محتوا، ملاک)
- حساسیت، ویژگی و نقاط برش تشخیصی
- خطای استاندارد اندازهگیری
- تفسیر هنجار-مرجع در مقابل ملاک-مرجع
Mechanisms
یک آزمون با ثابت کردن آیتمها، روش اجرا و قوانین نمرهگذاری، و سپس اجرای آن بر روی یک نمونه هنجاری انتخابشده برای نمایندگی جمعیت مورد نظر، استاندارد میشود. نمره خام یک فرد، با استفاده از توزیع آن نمونه، به یک نمره استاندارد یا درصد تبدیل میشود که موقعیت فرد را نسبت به همسالان نشان میدهد. ارزش تفسیری این موقعیت به پایایی آزمون (ثبات اندازهگیری)، روایی آن (اینکه آیا سازه مورد نظر را اندازهگیری میکند) و نمایندگی هنجارها بستگی دارد. استفاده تشخیصی یک قانون تصمیمگیری را اضافه میکند: یک نقطه برش که عملکرد زیر آن به عنوان اختلال در نظر گرفته میشود، که تعیین آن تعادل بین حساسیت و ویژگی را کنترل میکند (Spaulding, Plante, & Farinella, 2006).
Clinical relevance
نمرات هنجار-مرجع اغلب صلاحیت دریافت خدمات و شدت مستند شده یک اختلال ارتباطی را تعیین میکنند، بنابراین کیفیت روانسنجی آنها پیامدهای مستقیمی برای شناسایی افراد دارد. این مدخل توضیح میدهد که چگونه چنین نمراتی استخراج و تفسیر میشوند و تحت چه شرایطی قابل اعتماد هستند؛ این یک جهتگیری مرجع است و نحوه آزمون یا تشخیص یک فرد خاص را تجویز نمیکند.
Evidence & guidelines
بررسیهای روششناختی بارها نشان دادهاند که بسیاری از آزمونهای زبان و تولید گفتار منتشر شده، معیارهای روانسنجی اساسی برای پایایی، روایی و کفایت هنجاری را برآورده نمیکنند و در مورد اتکای بیرویه به نمرات آنها هشدار میدهند (McCauley & Swisher, 1984). تحلیل معیارهای صلاحیت نشان میدهد که نقاط برش رایج (به عنوان مثال، عملکرد یک یا چند انحراف معیار زیر میانگین) به طور مداوم کودکان دارای اختلال زبان را از همسالان با رشد طبیعی متمایز نمیکنند، زیرا آزمونها در دقت تشخیصی خود متفاوت هستند (Spaulding et al., 2006). استانداردهای آزمونهای آموزشی و روانشناختی انتظارات کلی برای توسعه آزمون، شواهد روایی و استفاده منصفانه را تعیین میکنند (AERA, APA, & NCME, 2014).
History
آزمون هنجار-مرجع در اختلالات ارتباطی در اواسط قرن بیستم همزمان با جنبش گستردهتر روانسنجی که توسط شخصیتهایی مانند آناستازی کدگذاری شد، به سرعت گسترش یافت. تا دهه 1980، تکثیر آزمونهای زبان و تولید گفتار، بررسی روانسنجی سیستماتیک را برانگیخت (McCauley & Swisher, 1984)، و کارهای بعدی تأکید را از نقاط برش راحت به سمت دقت تشخیصی مستند شده و ادغام نمرات استانداردشده با سایر شواهد ارزیابی تغییر داد (Spaulding et al., 2006).
Debates
- آیا عملکرد زیر یک نقطه برش متعارف برای تشخیص اختلال کافی است؟
- نقاط برش تشخیصی مانند -1 یا -1.25 انحراف معیار به طور گستردهای استفاده میشوند، اما حساسیت و ویژگی آنها در آزمونهای مختلف متفاوت است؛ اتکا به یک آستانه متعارف واحد میتواند منجر به شناسایی بیش از حد و کمتر از حد کودکان شود، بنابراین نقطه برش باید با دقت تشخیصی اندازهگیری شده آزمون توجیه شود.
- نمونههای هنجاری تا چه حد جمعیتهای متنوع را به خوبی نشان میدهند؟
- هنگامی که یک نمونه هنجاری نماینده پیشینه زبانی یا فرهنگی یک فرد نباشد، نمرات استاندارد ممکن است توانایی را نادرست نشان دهند و سوالات دیرینهای را در مورد استفاده منصفانه از آزمونهای هنجار-مرجع در بین جمعیتها مطرح کنند.
Key figures
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
Related topics
Seminal works
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Frequently asked questions
- تفاوت بین ارزیابی هنجار-مرجع و ملاک-مرجع چیست؟
- ارزیابی هنجار-مرجع نمره یک فرد را با توزیع یک نمونه مرجع مقایسه میکند تا موقعیت نسبی را نشان دهد، در حالی که ارزیابی ملاک-مرجع عملکرد را در برابر یک مهارت یا استاندارد تعریفشده، بدون توجه به عملکرد همسالان، مقایسه میکند.
- چرا خطای استاندارد اندازهگیری مهم است؟
- از آنجا که هیچ آزمونی کاملاً قابل اعتماد نیست، نمره به دست آمده یک تخمین است؛ خطای استاندارد اندازهگیری عدم قطعیت آن را کمیسازی میکند و به همین دلیل است که نمرات بهتر است به عنوان فواصل اطمینان به جای نقاط دقیق، به ویژه در نزدیکی یک نقطه برش تشخیصی، تفسیر شوند.