تفاوت بین ارزیابی هنجار-مرجع و ملاک-مرجع چیست؟

ارزیابی هنجار-مرجع نمره یک فرد را با توزیع یک نمونه مرجع مقایسه میکند تا موقعیت نسبی را نشان دهد، در حالی که ارزیابی ملاک-مرجع عملکرد را در برابر یک مهارت یا استاندارد تعریفشده، بدون توجه به عملکرد همسالان، مقایسه میکند.

چرا خطای استاندارد اندازهگیری مهم است؟

از آنجا که هیچ آزمونی کاملاً قابل اعتماد نیست، نمره به دست آمده یک تخمین است؛ خطای استاندارد اندازهگیری عدم قطعیت آن را کمیسازی میکند و به همین دلیل است که نمرات بهتر است به عنوان فواصل اطمینان به جای نقاط دقیق، به ویژه در نزدیکی یک نقطه برش تشخیصی، تفسیر شوند.

آزمون استانداردشده و ارزیابی هنجار-مرجع

آزمون استانداردشده و ارزیابی هنجار-مرجع به استفاده از ابزارهای رسمی اطلاق می‌شود که تحت شرایط ثابت اجرا و نمره‌گذاری می‌شوند، به طوری که عملکرد یک فرد می‌تواند با توزیع نمرات به دست آمده از یک نمونه مرجع (هنجاری) نماینده مقایسه شود. در آسیب‌شناسی گفتار-زبان، این ابزارها نمرات استاندارد، رتبه‌های درصدی و معادل‌های سنی را ارائه می‌دهند که برای حمایت از تصمیمات مربوط به صلاحیت، شدت و تشخیص استفاده می‌شوند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

آزمون هنجار-مرجع یک مقیاس است که تحت شرایط استانداردشده اجرا و نمره‌گذاری می‌شود و با مقایسه نمره خام یک فرد با توزیع نمرات یک نمونه هنجاری تعریف‌شده، که معمولاً به صورت نمرات استاندارد یا رتبه‌های درصدی بیان می‌شود، تفسیر می‌گردد.

Scope

این موضوع به منطق اندازه‌گیری هنجار-مرجع، معنای استانداردسازی، ویژگی‌های روان‌سنجی (پایایی، روایی، کفایت هنجاری) که قابلیت اعتماد یک آزمون را تعیین می‌کنند، و تفسیر و محدودیت‌های معیارهای برش می‌پردازد. این موضوع آزمون استانداردشده را به عنوان یکی از روش‌های ارزیابی در آسیب‌شناسی گفتار-زبان و به عنوان یک موضوع روش‌شناختی در نظر می‌گیرد، نه به عنوان دستورالعمل‌هایی برای آزمون یک فرد.

Core questions

یک نمره استاندارد واقعاً چه چیزی را در مورد یک فرد نسبت به همسالانش به ما می‌گوید؟
نمونه هنجاری، پایایی و روایی یک آزمون تا چه حد باید کافی باشد تا نمرات آن بتواند راهنمای تشخیص باشد؟
نقطه برش تشخیصی کجا باید تعیین شود و این انتخاب چگونه بر حساسیت و ویژگی تأثیر می‌گذارد؟
چه زمانی آزمون هنجار-مرجع ابزار اشتباهی است و چه چیزی باید آن را تکمیل کند؟

Key concepts

استانداردسازی اجرا و نمره‌گذاری
نمونه هنجاری (مرجع)
نمره استاندارد، رتبه درصدی، معادل سنی
پایایی (آزمون-بازآزمون، همسانی درونی)
روایی (سازه، محتوا، ملاک)
حساسیت، ویژگی و نقاط برش تشخیصی
خطای استاندارد اندازه‌گیری
تفسیر هنجار-مرجع در مقابل ملاک-مرجع

Mechanisms

یک آزمون با ثابت کردن آیتم‌ها، روش اجرا و قوانین نمره‌گذاری، و سپس اجرای آن بر روی یک نمونه هنجاری انتخاب‌شده برای نمایندگی جمعیت مورد نظر، استاندارد می‌شود. نمره خام یک فرد، با استفاده از توزیع آن نمونه، به یک نمره استاندارد یا درصد تبدیل می‌شود که موقعیت فرد را نسبت به همسالان نشان می‌دهد. ارزش تفسیری این موقعیت به پایایی آزمون (ثبات اندازه‌گیری)، روایی آن (اینکه آیا سازه مورد نظر را اندازه‌گیری می‌کند) و نمایندگی هنجارها بستگی دارد. استفاده تشخیصی یک قانون تصمیم‌گیری را اضافه می‌کند: یک نقطه برش که عملکرد زیر آن به عنوان اختلال در نظر گرفته می‌شود، که تعیین آن تعادل بین حساسیت و ویژگی را کنترل می‌کند (Spaulding, Plante, & Farinella, 2006).

Clinical relevance

نمرات هنجار-مرجع اغلب صلاحیت دریافت خدمات و شدت مستند شده یک اختلال ارتباطی را تعیین می‌کنند، بنابراین کیفیت روان‌سنجی آن‌ها پیامدهای مستقیمی برای شناسایی افراد دارد. این مدخل توضیح می‌دهد که چگونه چنین نمراتی استخراج و تفسیر می‌شوند و تحت چه شرایطی قابل اعتماد هستند؛ این یک جهت‌گیری مرجع است و نحوه آزمون یا تشخیص یک فرد خاص را تجویز نمی‌کند.

Evidence & guidelines

بررسی‌های روش‌شناختی بارها نشان داده‌اند که بسیاری از آزمون‌های زبان و تولید گفتار منتشر شده، معیارهای روان‌سنجی اساسی برای پایایی، روایی و کفایت هنجاری را برآورده نمی‌کنند و در مورد اتکای بی‌رویه به نمرات آن‌ها هشدار می‌دهند (McCauley & Swisher, 1984). تحلیل معیارهای صلاحیت نشان می‌دهد که نقاط برش رایج (به عنوان مثال، عملکرد یک یا چند انحراف معیار زیر میانگین) به طور مداوم کودکان دارای اختلال زبان را از همسالان با رشد طبیعی متمایز نمی‌کنند، زیرا آزمون‌ها در دقت تشخیصی خود متفاوت هستند (Spaulding et al., 2006). استانداردهای آزمون‌های آموزشی و روان‌شناختی انتظارات کلی برای توسعه آزمون، شواهد روایی و استفاده منصفانه را تعیین می‌کنند (AERA, APA, & NCME, 2014).

History

آزمون هنجار-مرجع در اختلالات ارتباطی در اواسط قرن بیستم همزمان با جنبش گسترده‌تر روان‌سنجی که توسط شخصیت‌هایی مانند آناستازی کدگذاری شد، به سرعت گسترش یافت. تا دهه 1980، تکثیر آزمون‌های زبان و تولید گفتار، بررسی روان‌سنجی سیستماتیک را برانگیخت (McCauley & Swisher, 1984)، و کارهای بعدی تأکید را از نقاط برش راحت به سمت دقت تشخیصی مستند شده و ادغام نمرات استانداردشده با سایر شواهد ارزیابی تغییر داد (Spaulding et al., 2006).

Debates

آیا عملکرد زیر یک نقطه برش متعارف برای تشخیص اختلال کافی است؟: نقاط برش تشخیصی مانند -1 یا -1.25 انحراف معیار به طور گسترده‌ای استفاده می‌شوند، اما حساسیت و ویژگی آن‌ها در آزمون‌های مختلف متفاوت است؛ اتکا به یک آستانه متعارف واحد می‌تواند منجر به شناسایی بیش از حد و کمتر از حد کودکان شود، بنابراین نقطه برش باید با دقت تشخیصی اندازه‌گیری شده آزمون توجیه شود.
نمونه‌های هنجاری تا چه حد جمعیت‌های متنوع را به خوبی نشان می‌دهند؟: هنگامی که یک نمونه هنجاری نماینده پیشینه زبانی یا فرهنگی یک فرد نباشد، نمرات استاندارد ممکن است توانایی را نادرست نشان دهند و سوالات دیرینه‌ای را در مورد استفاده منصفانه از آزمون‌های هنجار-مرجع در بین جمعیت‌ها مطرح کنند.

Key figures

Rebecca McCauley
Linda Swisher
Elena Plante
Tammie Spaulding
Anne Anastasi

Seminal works

mccauley-swisher-1984
spaulding-2006
anastasi-urbina-1997

Frequently asked questions

تفاوت بین ارزیابی هنجار-مرجع و ملاک-مرجع چیست؟: ارزیابی هنجار-مرجع نمره یک فرد را با توزیع یک نمونه مرجع مقایسه می‌کند تا موقعیت نسبی را نشان دهد، در حالی که ارزیابی ملاک-مرجع عملکرد را در برابر یک مهارت یا استاندارد تعریف‌شده، بدون توجه به عملکرد همسالان، مقایسه می‌کند.
چرا خطای استاندارد اندازه‌گیری مهم است؟: از آنجا که هیچ آزمونی کاملاً قابل اعتماد نیست، نمره به دست آمده یک تخمین است؛ خطای استاندارد اندازه‌گیری عدم قطعیت آن را کمی‌سازی می‌کند و به همین دلیل است که نمرات بهتر است به عنوان فواصل اطمینان به جای نقاط دقیق، به ویژه در نزدیکی یک نقطه برش تشخیصی، تفسیر شوند.