الاختبارات المعيارية والتقييم المرجعي للمعيار
الاختبارات المعيارية والتقييم المرجعي للمعيار هو استخدام أدوات رسمية تُطبق وتُصحح في ظل ظروف ثابتة، بحيث يمكن مقارنة أداء الفرد بتوزيع الدرجات التي تم الحصول عليها من عينة مرجعية (معيارية) ممثلة. في علم أمراض النطق واللغة، تُنتج هذه الأدوات درجات معيارية، ورتبًا مئوية، ومكافئات عمرية تُستخدم لدعم قرارات الأهلية والشدة والتشخيص.
Definition
الاختبار المرجعي للمعيار هو مقياس يُطبق ويُصحح في ظل ظروف معيارية ويُفسر بمقارنة الدرجة الخام للفرد بتوزيع الدرجات من عينة معيارية محددة، وعادةً ما يُعبر عنها كدرجات معيارية أو رتب مئوية.
Scope
يغطي هذا الموضوع منطق القياس المرجعي للمعيار، ومعنى المعايرة، والخصائص السيكومترية (الموثوقية، الصدق، الكفاية المعيارية) التي تحدد مدى جدارة الاختبار بالثقة، وتفسير حدود معايير القطع. يتعامل هذا الموضوع مع الاختبارات المعيارية كنمط واحد من التقييم ضمن علم أمراض النطق واللغة وكموضوع منهجي، وليس كتعليمات لاختبار فرد.
Core questions
- ماذا تخبرنا الدرجة المعيارية بالفعل عن الفرد بالنسبة لأقرانه؟
- ما مدى كفاية العينة المعيارية للاختبار وموثوقيته وصدقه قبل أن تتمكن درجاته من توجيه التشخيص؟
- أين يجب تحديد نقطة القطع التشخيصية، وكيف يؤثر هذا الاختيار على الحساسية والنوعية؟
- متى يكون الاختبار المرجعي للمعيار أداة خاطئة، وما الذي يجب أن يكمله؟
Key concepts
- معايرة التطبيق والتصحيح
- العينة المعيارية (المرجعية)
- الدرجة المعيارية، الرتبة المئوية، المكافئ العمري
- الموثوقية (إعادة الاختبار، الاتساق الداخلي)
- الصدق (البناء، المحتوى، المحك)
- الحساسية، النوعية، ونقاط القطع التشخيصية
- الخطأ المعياري للقياس
- التفسير المرجعي للمعيار مقابل التفسير المرجعي للمحك
Mechanisms
يُعيّر الاختبار عن طريق تثبيت البنود، وإجراء التطبيق، وقواعد التصحيح، ثم تطبيقه على عينة معيارية مختارة لتمثيل المجتمع المستهدف. تُحوّل الدرجة الخام للفرد، باستخدام توزيع تلك العينة، إلى درجة معيارية أو نسبة مئوية تحدد موقع الشخص بالنسبة لأقرانه. تعتمد القيمة التفسيرية لهذا الموضع على موثوقية الاختبار (اتساق القياس)، وصدقه (ما إذا كان يقيس البناء المقصود)، ومدى تمثيلية المعايير. يضيف الاستخدام التشخيصي قاعدة قرار: نقطة قطع يُعتبر الأداء دونها مضطربًا، ويتحكم موضعها في المفاضلة بين الحساسية والنوعية (Spaulding, Plante, & Farinella, 2006).
Clinical relevance
غالبًا ما تحدد الدرجات المرجعية للمعيار الأهلية للحصول على الخدمات والشدة الموثقة لاضطراب التواصل، لذا فإن جودتها السيكومترية لها عواقب مباشرة على من يتم تحديدهم. يصف هذا المدخل كيفية اشتقاق هذه الدرجات وتفسيرها والظروف التي تكون فيها جديرة بالثقة؛ وهو توجه مرجعي ولا يصف كيفية اختبار أو تشخيص شخص معين.
Evidence & guidelines
لقد وجدت المراجعات المنهجية مرارًا وتكرارًا أن العديد من اختبارات اللغة والنطق المنشورة لا تفي بالمعايير السيكومترية الأساسية للموثوقية والصدق والكفاية المعيارية، محذرةً من الاعتماد غير النقدي على درجاتها (McCauley & Swisher, 1984). تُظهر تحليلات معايير الأهلية أن نقاط القطع الشائعة (على سبيل المثال، الأداء بانحراف معياري واحد أو أكثر تحت المتوسط) لا تميز باستمرار الأطفال الذين يعانون من ضعف لغوي عن أقرانهم ذوي النمو الطبيعي، لأن الاختبارات تختلف في دقتها التشخيصية (Spaulding et al., 2006). تحدد معايير الاختبارات التربوية والنفسية التوقعات العامة لتطوير الاختبارات، وأدلة الصدق، والاستخدام العادل (AERA, APA, & NCME, 2014).
History
توسع الاختبار المرجعي للمعيار في اضطرابات التواصل بسرعة في منتصف القرن العشرين جنبًا إلى جنب مع الحركة السيكومترية الأوسع التي قننها شخصيات مثل أناستازي. بحلول الثمانينيات، أدى انتشار اختبارات اللغة والنطق إلى تدقيق سيكومتري منهجي (McCauley & Swisher, 1984)، وحولت الأعمال اللاحقة التركيز من نقاط القطع الملائمة نحو الدقة التشخيصية الموثقة ودمج الدرجات المعيارية مع أدلة التقييم الأخرى (Spaulding et al., 2006).
Debates
- هل الأداء دون نقطة قطع تقليدية كافٍ لتشخيص الضعف؟
- تُستخدم نقاط القطع التشخيصية مثل -1 أو -1.25 انحرافًا معياريًا على نطاق واسع، لكن حساسيتها ونوعيتها تختلف باختلاف الاختبارات؛ فالاعتماد على عتبة تقليدية واحدة يمكن أن يؤدي إلى الإفراط في تحديد الأطفال أو التقليل من تحديدهم، لذا يجب تبرير نقطة القطع بدقة التشخيص المقاسة للاختبار.
- ما مدى جودة تمثيل العينات المعيارية للمجتمعات المتنوعة؟
- عندما لا تمثل العينة المعيارية الخلفية اللغوية أو الثقافية للشخص، قد تسيء الدرجات المعيارية تمثيل القدرة، مما يثير تساؤلات قديمة حول الاستخدام العادل للاختبارات المرجعية للمعيار عبر المجتمعات.
Key figures
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
Related topics
Seminal works
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Frequently asked questions
- ما الفرق بين التقييم المرجعي للمعيار والتقييم المرجعي للمحك؟
- يقارن التقييم المرجعي للمعيار درجة الشخص بتوزيع عينة مرجعية لإظهار مكانته النسبية، بينما يقارن التقييم المرجعي للمحك الأداء بمعرفة أو معيار محدد بغض النظر عن أداء الأقران.
- لماذا يعتبر الخطأ المعياري للقياس مهمًا؟
- نظرًا لعدم وجود اختبار موثوق به تمامًا، فإن الدرجة المحصلة هي تقدير؛ يحدد الخطأ المعياري للقياس عدم اليقين فيه، ولهذا السبب من الأفضل تفسير الدرجات كفترات ثقة بدلاً من نقاط دقيقة، خاصة بالقرب من نقطة القطع التشخيصية.