Psikolojik Testler ve Psikometri
Psikometri, psikolojik nitelikleri ölçme bilimidir: testlerin nasıl oluşturulduğu, puanlarının nasıl nicelleştirildiği ve güvenilirlik, geçerlilik ve adilliğin nasıl sağlandığı konularını ele alarak, bir testten elde edilen bir sayının güvenle yorumlanabilmesini sağlamayı amaçlar.
Tanım
Psikometri, psikolojik ölçmenin kuramı ve tekniğiyle ilgilenen psikoloji dalıdır; testlerin tasarımı, uygulanması, puanlanması ve geçerliliğinin belirlenmesi ile gözlenen puanları temel niteliklerle ilişkilendiren istatistiksel modelleri kapsamaktadır.
Kapsam
Bu konu, yanıtları yorumlanabilir puanlara dönüştüren kuram ve yöntemleri kapsamaktadır: klasik test kuramı ve gerçek puan modeli, güvenilirlik ve ölçme hatası, geçerlilik çerçevesi, madde düzeyinde analiz, norm oluşturma ve standardizasyon ile test adilliği. Bu, ölçme üzerine metodolojik bir giriştir; herhangi bir birey için test seçme veya puanlama konusunda bir rehberlik sağlamamaktadır.
Temel sorular
- Gözlenen bir puanın ne kadarı niteliği, ne kadarı ölçme hatasını yansıtmaktadır?
- Bir puanın amaçlanan bir yapıyı ölçtüğü şeklinde yorumlanabilmesi için hangi kanıtlara ihtiyaç duyulmaktadır?
- Test maddeleri nasıl analiz edilir, seçilir ve ölçeklendirilir?
- Puanlar, normlar ve standardizasyon aracılığıyla insanlar arasında nasıl karşılaştırılabilir hale getirilir?
Anahtar kavramlar
- Gerçek puan ve ölçme hatası
- Güvenilirlik (iç tutarlılık, test-tekrar test, derecelendiriciler arası)
- İçerik, ölçüt ve yapı geçerliliği
- Madde analizi ve güçlük/ayırt edicilik
- Normlar, standardizasyon ve standart puanlar
- Madde tepki kuramı
- Ölçme değişmezliği ve test adilliği
Temel kuramlar
- Klasik test kuramı
- Klasik test kuramı, gözlenen bir puanı gerçek puan ve rastgele hatanın toplamı olarak modeller; buradan güvenilirlik, gözlenen puan varyansının gerçek puan varyansına atfedilebilir oranı olarak tanımlanır. Lord ve Novick, bu alana titiz istatistiksel formülasyonunu kazandırmıştır.
- Birleşik yapı geçerliliği
- Cronbach ve Meehl, geçerliliği bir testin çıkarsadığı yapı etrafında çerçevelemiş; Messick ise içerik, ölçüt ve yapı kanıtlarını, puan yorumlamasının gerekçelendirilmesi ve sonuçları hakkında tek bir argümanda birleştirmiştir.
Mekanizmalar
Klasik modelde, gözlenen bir puan gerçek puan artı rastgele hata olarak ele alınır ve güvenilirlik, varyansın gerçek puan varyansına ait payını nicelleştirir; Lord ve Novick, bunu ve daha sonraki madde tepki modellerini formüle etmiştir. Geçerlilik, bir puanın amaçlanan bir çıkarımı desteklediğine dair güvencedir: Cronbach ve Meehl bunu yapı ve onun nomolojik ağı içinde konumlandırmış, Haynes ve arkadaşları içerik geçerliliğini maddelerin hedef alana sistematik olarak eşleşmesi olarak detaylandırmış ve Messick, kanıt türlerini yorumlamanın sonuçlarını da dikkate alan bir argümanda birleştirmiştir. Normlar ve standardizasyon, puanları tanımlanmış bir popülasyona referans alarak karşılaştırılabilir hale getirmektedir.
Klinik önem
Psikometrik özellikler, klinik bir test puanına güvenilip güvenilemeyeceğini ve ne anlama gelebileceğini belirlemektedir; bu nedenle güvenilirlik ve geçerlilik kanıtları, klinik psikolojide test kullanımının her savunulabilir temelini oluşturmaktadır. Bu madde, bu özellikleri ölçme kavramları olarak açıklamakta olup, herhangi bir kişi için belirli araçları veya kesme noktalarını önermemektedir.
Kanıt ve kılavuzlar
Eğitimsel ve Psikolojik Testler Standartları, test geliştirme ve kullanımında güvenilirlik, geçerlilik ve adillik beklentilerini kodlamaktadır. Cronbach ve Meehl, Messick ile Haynes ve arkadaşları, geçerlilik çerçevesi için standart metodolojik referanslar olarak kabul edilmektedir; Lord ve Novick ise klasik ve madde tepki test kuramının kanonik ifadesini sunmaktadır.
Tarihçe
Zihinsel ölçme, on dokuzuncu yüzyıldaki bireysel farklılıklar üzerine yapılan çalışmalardan ortaya çıkmış ve yirminci yüzyılın ilk yarısında klasik test kuramı olarak sistemleştirilmiştir. Cronbach ve Meehl'in 1955 tarihli makalesi yapı geçerliliğini merkezi hale getirmiş, Lord ve Novick'in 1968 tarihli monografisi alana titiz bir istatistiksel ve madde tepki temeli sağlamış ve Messick'in daha sonraki sentezi, geçerlilik kavramını çıkarımların gerekçelendirilmesi ve sosyal sonuçları etrafında birleştirmiştir.
Tartışmalar
- Geçerlilik testlerin mi, yoksa çıkarımların mı bir özelliğidir?
- Alan, büyük ölçüde geçerli testlerden bahsetmekten, puanlardan elde edilen çıkarımları ve kullanımları geçerlileştirmeye doğru kaymıştır; test etmenin sonuçlarının geçerlilik kavramının ne kadar içinde yer alması gerektiği konusunda ise tartışmalar devam etmektedir.
Öne çıkan isimler
- Lee Cronbach
- Paul Meehl
- Samuel Messick
- Frederic Lord
- Melvin Novick
İlgili konular
Temel eserler
- cronbach-meehl-1955
- lord-novick-1968
- messick-1995
Sıkça sorulan sorular
- Güvenilirlik ve geçerlilik arasındaki fark nedir?
- Güvenilirlik, bir ölçümün tutarlılığıdır (rastgele hatadan ne kadar az etkilendiği); geçerlilik ise bir puandan elde edilen çıkarımın gerekçelendirilip gerekçelendirilmediğidir. Bir test belirli bir amaç için geçerli olmadan güvenilir olabilir, ancak makul ölçüde güvenilir olmadan geçerli olamaz.
- Yapı geçerliliği ne anlama gelmektedir?
- Bu, bir testin amaçlanan, teorik olarak tanımlanmış bir niteliği ölçtüğü şeklinde yorumlanabilme derecesidir ve testin diğer değişkenlerle kuramın öngördüğü şekilde ilişkili olduğuna dair kanıtlar biriktirilerek belirlenmektedir.