Güvenilirlik ve geçerlilik arasındaki fark nedir?

Güvenilirlik, bir ölçümün tutarlılığıdır (rastgele hatadan ne kadar az etkilendiği); geçerlilik ise bir puandan elde edilen çıkarımın gerekçelendirilip gerekçelendirilmediğidir. Bir test belirli bir amaç için geçerli olmadan güvenilir olabilir, ancak makul ölçüde güvenilir olmadan geçerli olamaz.

Yapı geçerliliği ne anlama gelmektedir?

Bu, bir testin amaçlanan, teorik olarak tanımlanmış bir niteliği ölçtüğü şeklinde yorumlanabilme derecesidir ve testin diğer değişkenlerle kuramın öngördüğü şekilde ilişkili olduğuna dair kanıtlar biriktirilerek belirlenmektedir.

Psikolojik Testler ve Psikometri

Psikometri, psikolojik nitelikleri ölçme bilimidir: testlerin nasıl oluşturulduğu, puanlarının nasıl nicelleştirildiği ve güvenilirlik, geçerlilik ve adilliğin nasıl sağlandığı konularını ele alarak, bir testten elde edilen bir sayının güvenle yorumlanabilmesini sağlamayı amaçlar.

PaperMind ile konu bulYakındaMakale ve konu bul

Tools & resources

Slaytları indir

Learn & explore

VideoYakında

Tanım

Psikometri, psikolojik ölçmenin kuramı ve tekniğiyle ilgilenen psikoloji dalıdır; testlerin tasarımı, uygulanması, puanlanması ve geçerliliğinin belirlenmesi ile gözlenen puanları temel niteliklerle ilişkilendiren istatistiksel modelleri kapsamaktadır.

Kapsam

Bu konu, yanıtları yorumlanabilir puanlara dönüştüren kuram ve yöntemleri kapsamaktadır: klasik test kuramı ve gerçek puan modeli, güvenilirlik ve ölçme hatası, geçerlilik çerçevesi, madde düzeyinde analiz, norm oluşturma ve standardizasyon ile test adilliği. Bu, ölçme üzerine metodolojik bir giriştir; herhangi bir birey için test seçme veya puanlama konusunda bir rehberlik sağlamamaktadır.

Temel sorular

Gözlenen bir puanın ne kadarı niteliği, ne kadarı ölçme hatasını yansıtmaktadır?
Bir puanın amaçlanan bir yapıyı ölçtüğü şeklinde yorumlanabilmesi için hangi kanıtlara ihtiyaç duyulmaktadır?
Test maddeleri nasıl analiz edilir, seçilir ve ölçeklendirilir?
Puanlar, normlar ve standardizasyon aracılığıyla insanlar arasında nasıl karşılaştırılabilir hale getirilir?

Anahtar kavramlar

Gerçek puan ve ölçme hatası
Güvenilirlik (iç tutarlılık, test-tekrar test, derecelendiriciler arası)
İçerik, ölçüt ve yapı geçerliliği
Madde analizi ve güçlük/ayırt edicilik
Normlar, standardizasyon ve standart puanlar
Madde tepki kuramı
Ölçme değişmezliği ve test adilliği

Temel kuramlar

Klasik test kuramı: Klasik test kuramı, gözlenen bir puanı gerçek puan ve rastgele hatanın toplamı olarak modeller; buradan güvenilirlik, gözlenen puan varyansının gerçek puan varyansına atfedilebilir oranı olarak tanımlanır. Lord ve Novick, bu alana titiz istatistiksel formülasyonunu kazandırmıştır.
Birleşik yapı geçerliliği: Cronbach ve Meehl, geçerliliği bir testin çıkarsadığı yapı etrafında çerçevelemiş; Messick ise içerik, ölçüt ve yapı kanıtlarını, puan yorumlamasının gerekçelendirilmesi ve sonuçları hakkında tek bir argümanda birleştirmiştir.

Mekanizmalar

Klasik modelde, gözlenen bir puan gerçek puan artı rastgele hata olarak ele alınır ve güvenilirlik, varyansın gerçek puan varyansına ait payını nicelleştirir; Lord ve Novick, bunu ve daha sonraki madde tepki modellerini formüle etmiştir. Geçerlilik, bir puanın amaçlanan bir çıkarımı desteklediğine dair güvencedir: Cronbach ve Meehl bunu yapı ve onun nomolojik ağı içinde konumlandırmış, Haynes ve arkadaşları içerik geçerliliğini maddelerin hedef alana sistematik olarak eşleşmesi olarak detaylandırmış ve Messick, kanıt türlerini yorumlamanın sonuçlarını da dikkate alan bir argümanda birleştirmiştir. Normlar ve standardizasyon, puanları tanımlanmış bir popülasyona referans alarak karşılaştırılabilir hale getirmektedir.

Klinik önem

Psikometrik özellikler, klinik bir test puanına güvenilip güvenilemeyeceğini ve ne anlama gelebileceğini belirlemektedir; bu nedenle güvenilirlik ve geçerlilik kanıtları, klinik psikolojide test kullanımının her savunulabilir temelini oluşturmaktadır. Bu madde, bu özellikleri ölçme kavramları olarak açıklamakta olup, herhangi bir kişi için belirli araçları veya kesme noktalarını önermemektedir.

Kanıt ve kılavuzlar

Eğitimsel ve Psikolojik Testler Standartları, test geliştirme ve kullanımında güvenilirlik, geçerlilik ve adillik beklentilerini kodlamaktadır. Cronbach ve Meehl, Messick ile Haynes ve arkadaşları, geçerlilik çerçevesi için standart metodolojik referanslar olarak kabul edilmektedir; Lord ve Novick ise klasik ve madde tepki test kuramının kanonik ifadesini sunmaktadır.

Tarihçe

Zihinsel ölçme, on dokuzuncu yüzyıldaki bireysel farklılıklar üzerine yapılan çalışmalardan ortaya çıkmış ve yirminci yüzyılın ilk yarısında klasik test kuramı olarak sistemleştirilmiştir. Cronbach ve Meehl'in 1955 tarihli makalesi yapı geçerliliğini merkezi hale getirmiş, Lord ve Novick'in 1968 tarihli monografisi alana titiz bir istatistiksel ve madde tepki temeli sağlamış ve Messick'in daha sonraki sentezi, geçerlilik kavramını çıkarımların gerekçelendirilmesi ve sosyal sonuçları etrafında birleştirmiştir.

Tartışmalar

Geçerlilik testlerin mi, yoksa çıkarımların mı bir özelliğidir?: Alan, büyük ölçüde geçerli testlerden bahsetmekten, puanlardan elde edilen çıkarımları ve kullanımları geçerlileştirmeye doğru kaymıştır; test etmenin sonuçlarının geçerlilik kavramının ne kadar içinde yer alması gerektiği konusunda ise tartışmalar devam etmektedir.

Öne çıkan isimler

Lee Cronbach
Paul Meehl
Samuel Messick
Frederic Lord
Melvin Novick

İlgili konular

Temel eserler

cronbach-meehl-1955
lord-novick-1968
messick-1995

Sıkça sorulan sorular

Güvenilirlik ve geçerlilik arasındaki fark nedir?: Güvenilirlik, bir ölçümün tutarlılığıdır (rastgele hatadan ne kadar az etkilendiği); geçerlilik ise bir puandan elde edilen çıkarımın gerekçelendirilip gerekçelendirilmediğidir. Bir test belirli bir amaç için geçerli olmadan güvenilir olabilir, ancak makul ölçüde güvenilir olmadan geçerli olamaz.
Yapı geçerliliği ne anlama gelmektedir?: Bu, bir testin amaçlanan, teorik olarak tanımlanmış bir niteliği ölçtüğü şeklinde yorumlanabilme derecesidir ve testin diğer değişkenlerle kuramın öngördüğü şekilde ilişkili olduğuna dair kanıtlar biriktirilerek belirlenmektedir.