Standardize Testler ve Norm Referanslı Değerlendirme
Standardize testler ve norm referanslı değerlendirme, bireyin performansının temsili bir referans (normatif) örneklemden elde edilen puan dağılımıyla karşılaştırılabilmesi için sabit koşullar altında uygulanan ve puanlanan resmi araçların kullanılmasıdır. Konuşma-dil patolojisinde bu araçlar, uygunluk, şiddet ve tanı kararlarını desteklemek için kullanılan standart puanlar, yüzdelik sıralamalar ve yaş eşdeğerleri sağlamaktadır.
Tanım
Norm referanslı bir test, standardize koşullar altında uygulanan ve puanlanan, bireyin ham puanının tanımlanmış bir normatif örneklemden elde edilen puan dağılımıyla karşılaştırılarak yorumlanan bir ölçümdür; tipik olarak standart puanlar veya yüzdelik sıralamalar olarak ifade edilmektedir.
Kapsam
Bu konu, norm referanslı ölçümün mantığını, standardizasyonun anlamını, bir testin güvenilirliğini belirleyen psikometrik özellikleri (güvenilirlik, geçerlilik, normatif yeterlilik) ve kesme kriterlerinin yorumlanmasını ve sınırlarını kapsamaktadır. Standardize testi, konuşma-dil patolojisi içinde bir değerlendirme modu ve metodolojik bir konu olarak ele almakta, bireysel test talimatları olarak değerlendirmemektedir.
Temel sorular
- Standart bir puan, bir birey hakkında akranlarına göre bize aslında ne anlatmaktadır?
- Bir testin normatif örneklemi, güvenilirliği ve geçerliliği, puanları tanıya rehberlik etmeden önce ne kadar yeterli olmalıdır?
- Tanısal bir kesme noktası nereye ayarlanmalıdır ve bu seçim duyarlılık ve özgüllüğü nasıl etkilemektedir?
- Norm referanslı test ne zaman yanlış bir araçtır ve onu ne tamamlamalıdır?
Anahtar kavramlar
- Uygulama ve puanlamanın standardizasyonu
- Normatif (referans) örneklem
- Standart puan, yüzdelik sıralama, yaş eşdeğeri
- Güvenilirlik (test-tekrar test, iç tutarlılık)
- Geçerlilik (yapı, içerik, kriter)
- Duyarlılık, özgüllük ve tanısal kesme noktaları
- Ölçmenin standart hatası
- Norm referanslıya karşı kriter referanslı yorumlama
Mekanizmalar
Bir test, maddeleri, uygulama prosedürünü ve puanlama kurallarını sabitleyerek ve ardından ilgili popülasyonu temsil etmek üzere seçilen normatif bir örnekleme uygulayarak standardize edilmektedir. Bireyin ham puanı, o örneklemin dağılımı kullanılarak, kişiyi akranlarına göre konumlandıran bir standart puana veya yüzdeliğe dönüştürülmektedir. Bu konumun yorumlayıcı değeri, testin güvenilirliğine (ölçüm tutarlılığı), geçerliliğine (amaçlanan yapıyı ölçüp ölçmediği) ve normların temsil edilebilirliğine bağlıdır. Tanısal kullanım, bir karar kuralı eklemektedir: performansın bozukluk olarak kabul edildiği bir kesme noktası; bu noktanın yerleşimi, duyarlılık ve özgüllük (Spaulding, Plante, & Farinella, 2006) arasındaki dengeyi yönetmektedir.
Klinik önem
Norm referanslı puanlar, hizmetlere uygunluğu ve bir iletişim bozukluğunun belgelenmiş şiddetini sıklıkla belirlemektedir; bu nedenle psikometrik kaliteleri, kimin tanımlandığı konusunda doğrudan sonuçlar doğurmaktadır. Bu madde, bu tür puanların nasıl türetildiğini ve yorumlandığını ve hangi koşullar altında güvenilir olduklarını açıklamaktadır; bu bir referans yönelimidir ve belirli bir kişiyi nasıl test edeceğini veya teşhis edeceğini reçete etmemektedir.
Kanıt ve kılavuzlar
Metodolojik incelemeler, yayınlanmış birçok dil ve artikülasyon testinin güvenilirlik, geçerlilik ve normatif yeterlilik için temel psikometrik kriterleri karşılamadığını defalarca bulmuş ve puanlarına eleştirel olmayan bir şekilde güvenilmemesi konusunda uyarıda bulunmuştur (McCauley & Swisher, 1984). Uygunluk kriterlerinin analizleri, yaygın kesme noktalarının (örneğin, ortalamanın bir veya daha fazla standart sapma altında performans) dil bozukluğu olan çocukları tipik gelişim gösteren akranlarından tutarlı bir şekilde ayırt etmediğini göstermektedir, çünkü testler tanısal doğrulukları açısından farklılık göstermektedir (Spaulding et al., 2006). Eğitimsel ve Psikolojik Testler için Standartlar (AERA, APA, & NCME, 2014), test geliştirme, geçerlilik kanıtı ve adil kullanım için genel beklentileri ortaya koymaktadır.
Tarihçe
İletişim bozukluklarında norm referanslı testler, Anastasi gibi figürler tarafından kodlanan daha geniş psikometrik hareketle birlikte yirminci yüzyılın ortalarında hızla genişlemiştir. 1980'lere gelindiğinde, dil ve artikülasyon testlerinin çoğalması sistematik psikometrik incelemeyi teşvik etmiş (McCauley & Swisher, 1984) ve sonraki çalışmalar, uygun kesme noktalarından belgelenmiş tanısal doğruluğa ve standardize puanların diğer değerlendirme kanıtlarıyla entegrasyonuna doğru vurguyu kaydırmıştır (Spaulding et al., 2006).
Tartışmalar
- Geleneksel bir kesme noktasının altındaki performans, bozukluğu teşhis etmek için yeterli midir?
- −1 veya −1.25 standart sapma gibi tanısal kesme noktaları yaygın olarak kullanılmaktadır, ancak duyarlılıkları ve özgüllükleri testler arasında değişmektedir; tek bir geleneksel eşiğe güvenmek, çocukları hem aşırı hem de eksik tanımlayabilir, bu nedenle kesme noktası testin ölçülen tanısal doğruluğu ile gerekçelendirilmelidir.
- Normatif örneklemler çeşitli popülasyonları ne kadar iyi temsil etmektedir?
- Normatif bir örneklem, bir kişinin dilsel veya kültürel geçmişini temsil etmediğinde, standart puanlar yeteneği yanlış temsil edebilir, bu da norm referanslı testlerin popülasyonlar arasında adil kullanımı hakkında uzun süredir devam eden soruları gündeme getirmektedir.
Öne çıkan isimler
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
İlgili konular
Temel eserler
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Sıkça sorulan sorular
- Norm referanslı ve kriter referanslı değerlendirme arasındaki fark nedir?
- Norm referanslı değerlendirme, bir kişinin puanını bir referans örneklemin dağılımıyla karşılaştırarak göreceli konumunu göstermektedir; oysa kriter referanslı değerlendirme, akranların nasıl performans gösterdiğine bakılmaksızın performansı tanımlanmış bir beceri veya standarda göre karşılaştırmaktadır.
- Ölçmenin standart hatası neden önemlidir?
- Hiçbir test mükemmel güvenilir olmadığı için, elde edilen bir puan bir tahmindir; ölçmenin standart hatası belirsizliğini nicelendirmektedir ve bu nedenle puanlar, özellikle tanısal bir kesme noktasına yakın olduğunda, kesin noktalar yerine güven aralıkları olarak yorumlanması en iyisidir.