الاختبارات النفسية والقياس النفسي
القياس النفسي هو علم قياس السمات النفسية: كيفية بناء الاختبارات، وكيفية تحديد درجاتها كمياً، وكيفية إثبات الموثوقية والصلاحية والإنصاف بحيث يمكن تفسير الرقم المستمد من الاختبار بثقة.
Definition
القياس النفسي هو فرع علم النفس المعني بنظرية وتقنية القياس النفسي، بما في ذلك تصميم الاختبارات وإدارتها وتسجيلها والتحقق من صحتها، والنماذج الإحصائية التي تربط الدرجات المرصودة بالسمات الأساسية.
Scope
يغطي هذا الموضوع النظرية والأساليب التي تحول الاستجابات إلى درجات قابلة للتفسير: نظرية الاختبار الكلاسيكية ونموذج الدرجة الحقيقية، والموثوقية وخطأ القياس، وإطار الصلاحية، وتحليل مستوى البند، والمعايرة والتوحيد القياسي، وإنصاف الاختبار. إنه مدخل منهجي حول القياس، وليس إرشادات حول اختيار أو تسجيل الاختبارات لأي فرد.
Core questions
- ما مقدار الدرجة المرصودة الذي يعكس السمة مقابل خطأ القياس؟
- ما الدليل المطلوب قبل أن يمكن تفسير الدرجة على أنها تقيس بناءً مقصودًا؟
- كيف يتم تحليل بنود الاختبار واختيارها وتصنيفها؟
- كيف تُجعل الدرجات قابلة للمقارنة بين الأشخاص من خلال المعايير والتوحيد القياسي؟
Key concepts
- الدرجة الحقيقية وخطأ القياس
- الموثوقية (الاتساق الداخلي، إعادة الاختبار، اتفاق المقيمين)
- صلاحية المحتوى، المعيار، والبناء
- تحليل البند والصعوبة/التمييز
- المعايير، التوحيد القياسي، والدرجات المعيارية
- نظرية استجابة البند
- ثبات القياس وإنصاف الاختبار
Key theories
- نظرية الاختبار الكلاسيكية
- تُنمذج نظرية الاختبار الكلاسيكية الدرجة المرصودة على أنها مجموع درجة حقيقية وخطأ عشوائي، ومنها تُعرّف الموثوقية على أنها نسبة تباين الدرجة المرصودة المنسوبة إلى تباين الدرجة الحقيقية؛ وقد قدم لورد ونوفيك (Lord and Novick) للمجال صياغته الإحصائية الصارمة.
- صلاحية البناء الموحدة
- صاغ كرونباخ وميل (Cronbach and Meehl) الصلاحية حول البناء الذي يستنتجه الاختبار، ووحد ميسيك (Messick) أدلة المحتوى والمعيار والبناء في حجة واحدة حول تبرير وتداعيات تفسير الدرجة.
Mechanisms
في النموذج الكلاسيكي، تُعامل الدرجة المرصودة على أنها درجة حقيقية بالإضافة إلى خطأ عشوائي، وتقيس الموثوقية حصة التباين التي هي تباين الدرجة الحقيقية؛ وقد قام لورد ونوفيك (Lord and Novick) بإضفاء الطابع الرسمي على هذا وعلى نماذج استجابة البند اللاحقة. الصلاحية هي الضمان بأن الدرجة تدعم استنتاجًا مقصودًا: وقد وضعها كرونباخ وميل (Cronbach and Meehl) في البناء وشبكته القانونية، وفصّل هاينز وزملاؤه (Haynes and colleagues) صلاحية المحتوى على أنها المطابقة المنهجية للبنود مع المجال المستهدف، ووحد ميسيك (Messick) أنواع الأدلة في حجة تزن أيضًا عواقب التفسير. المعايير والتوحيد القياسي يجعلان الدرجات قابلة للمقارنة عن طريق ربطها بمجتمع محدد.
Clinical relevance
تحدد الخصائص السيكومترية ما إذا كان يمكن الوثوق بدرجة الاختبار السريري وماذا يمكن أن تعنيه، لذا فإن أدلة الموثوقية والصلاحية تدعم كل استخدام مبرر للاختبار في علم النفس السريري. يشرح هذا المدخل هذه الخصائص كمفاهيم قياس؛ ولا يوصي بأدوات أو نقاط قطع محددة لأي شخص.
Evidence & guidelines
تُقنن معايير الاختبارات التربوية والنفسية (The Standards for Educational and Psychological Testing) التوقعات الخاصة بالموثوقية والصلاحية والإنصاف في تطوير الاختبارات واستخدامها. يُعد كرونباخ وميل (Cronbach and Meehl)، وميسيك (Messick)، وهاينز وزملاؤه (Haynes and colleagues) مراجع منهجية قياسية لإطار الصلاحية، ويُعد لورد ونوفيك (Lord and Novick) البيان الأساسي لنظرية الاختبار الكلاسيكية ونظرية استجابة البند.
History
نشأ القياس العقلي من أعمال القرن التاسع عشر حول الفروق الفردية وتم تنظيمه كنظرية اختبار كلاسيكية في النصف الأول من القرن العشرين. جعلت ورقة كرونباخ وميل (Cronbach and Meehl) عام 1955 صلاحية البناء مركزية، وقدمت دراسة لورد ونوفيك (Lord and Novick) عام 1968 أساسًا إحصائيًا صارمًا وأساسًا لاستجابة البند للمجال، ووحد تركيب ميسيك (Messick) اللاحق مفهوم الصلاحية حول تبرير الاستدلالات وعواقبها الاجتماعية.
Debates
- هل الصلاحية خاصية للاختبارات أم للاستدلالات؟
- انتقل المجال إلى حد كبير من الحديث عن الاختبارات الصالحة إلى التحقق من صحة الاستدلالات والاستخدامات المستمدة من الدرجات، مع استمرار النقاش حول مدى انتماء عواقب الاختبار إلى مفهوم الصلاحية.
Key figures
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
Related topics
Seminal works
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Frequently asked questions
- ما الفرق بين الموثوقية والصلاحية؟
- الموثوقية هي اتساق القياس (مدى تأثره بالخطأ العشوائي)، بينما الصلاحية هي ما إذا كان الاستنتاج المستمد من الدرجة مبررًا؛ يمكن أن يكون الاختبار موثوقًا دون أن يكون صالحًا لغرض معين، لكن لا يمكن أن يكون صالحًا دون أن يكون موثوقًا بشكل معقول.
- ماذا تعني صلاحية البناء؟
- هي الدرجة التي يمكن بها تفسير الاختبار على أنه يقيس سمة مقصودة ومحددة نظريًا، ويتم إثبات ذلك من خلال تجميع الأدلة على أن الاختبار يرتبط بمتغيرات أخرى كما تتنبأ النظرية.