ScholarGate
Asisten

Pengujian Terstandardisasi dan Penilaian Acuan Norma

Pengujian terstandardisasi dan penilaian acuan norma adalah penggunaan instrumen formal yang diberikan dan dinilai dalam kondisi tetap, sehingga kinerja individu dapat dibandingkan dengan distribusi skor yang diperoleh dari sampel referensi (normatif) yang representatif. Dalam patologi wicara-bahasa, alat-alat ini menghasilkan skor standar, peringkat persentil, dan ekuivalen usia yang digunakan untuk mendukung keputusan kelayakan, tingkat keparahan, dan diagnostik.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Tes acuan norma adalah ukuran yang diberikan dan dinilai dalam kondisi terstandardisasi dan diinterpretasikan dengan membandingkan skor mentah individu dengan distribusi skor dari sampel normatif yang terdefinisi, biasanya dinyatakan sebagai skor standar atau peringkat persentil.

Scope

Topik ini mencakup logika pengukuran acuan norma, makna standardisasi, properti psikometrik (reliabilitas, validitas, kecukupan normatif) yang menentukan kepercayaan suatu tes, serta interpretasi dan batasan kriteria batas. Topik ini memperlakukan pengujian terstandardisasi sebagai salah satu mode penilaian dalam patologi wicara-bahasa dan sebagai subjek metodologis, bukan sebagai instruksi untuk menguji individu.

Core questions

  • Apa sebenarnya yang diberitahukan oleh skor standar tentang seorang individu relatif terhadap teman sebaya?
  • Seberapa memadai sampel normatif, reliabilitas, dan validitas suatu tes sebelum skornya dapat memandu diagnosis?
  • Di mana batas diagnostik harus ditetapkan, dan bagaimana pilihan itu memengaruhi sensitivitas dan spesifisitas?
  • Kapan pengujian acuan norma menjadi alat yang salah, dan apa yang harus melengkapinya?

Key concepts

  • Standardisasi administrasi dan penilaian
  • Sampel normatif (referensi)
  • Skor standar, peringkat persentil, ekuivalen usia
  • Reliabilitas (uji-ulang, konsistensi internal)
  • Validitas (konstruk, isi, kriteria)
  • Sensitivitas, spesifisitas, dan batas diagnostik
  • Kesalahan standar pengukuran
  • Interpretasi acuan norma versus acuan kriteria

Mechanisms

Suatu tes distandardisasi dengan menetapkan item, prosedur pemberian, dan aturan penilaian, kemudian diberikan kepada sampel normatif yang dipilih untuk mewakili populasi yang diminati. Skor mentah individu diubah, menggunakan distribusi sampel tersebut, menjadi skor standar atau persentil yang menempatkan individu relatif terhadap teman sebaya. Nilai interpretatif dari posisi ini bergantung pada reliabilitas tes (konsistensi pengukuran), validitasnya (apakah tes tersebut mengukur konstruk yang dimaksud), dan representativitas norma. Penggunaan diagnostik menambahkan aturan keputusan: batas di bawah mana kinerja diperlakukan sebagai gangguan, yang penempatannya mengatur pertukaran antara sensitivitas dan spesifisitas (Spaulding, Plante, & Farinella, 2006).

Clinical relevance

Skor acuan norma sering kali menentukan kelayakan untuk layanan dan tingkat keparahan gangguan komunikasi yang didokumentasikan, sehingga kualitas psikometriknya memiliki konsekuensi langsung terhadap siapa yang diidentifikasi. Entri ini menjelaskan bagaimana skor tersebut diturunkan dan diinterpretasikan serta kondisi di mana skor tersebut dapat dipercaya; ini adalah orientasi referensi dan tidak menentukan cara menguji atau mendiagnosis orang tertentu.

Evidence & guidelines

Tinjauan metodologis telah berulang kali menemukan bahwa banyak tes bahasa dan artikulasi yang diterbitkan tidak memenuhi kriteria psikometrik dasar untuk reliabilitas, validitas, dan kecukupan normatif, sehingga memperingatkan agar tidak terlalu bergantung pada skor mereka (McCauley & Swisher, 1984). Analisis kriteria kelayakan menunjukkan bahwa batas umum (misalnya, kinerja satu atau lebih deviasi standar di bawah rata-rata) tidak secara konsisten membedakan anak-anak dengan gangguan bahasa dari teman sebaya yang berkembang secara tipikal, karena tes berbeda dalam akurasi diagnostiknya (Spaulding et al., 2006). Standar untuk Pengujian Pendidikan dan Psikologis menetapkan harapan umum untuk pengembangan tes, bukti validitas, dan penggunaan yang adil (AERA, APA, & NCME, 2014).

History

Pengujian acuan norma dalam gangguan komunikasi berkembang pesat pada pertengahan abad ke-20 bersamaan dengan gerakan psikometrik yang lebih luas yang dikodifikasi oleh tokoh-tokoh seperti Anastasi. Pada tahun 1980-an, proliferasi tes bahasa dan artikulasi mendorong pengawasan psikometrik sistematis (McCauley & Swisher, 1984), dan pekerjaan selanjutnya menggeser penekanan dari batas yang mudah menuju akurasi diagnostik yang didokumentasikan dan integrasi skor terstandardisasi dengan bukti penilaian lainnya (Spaulding et al., 2006).

Debates

Apakah kinerja di bawah batas konvensional cukup untuk mendiagnosis gangguan?
Batas diagnostik seperti -1 atau -1,25 deviasi standar banyak digunakan, tetapi sensitivitas dan spesifisitasnya bervariasi antar tes; mengandalkan ambang batas konvensional tunggal dapat menyebabkan identifikasi berlebihan dan kurang pada anak-anak, sehingga batas harus dibenarkan oleh akurasi diagnostik tes yang terukur.
Seberapa baik sampel normatif mewakili populasi yang beragam?
Ketika sampel normatif tidak mewakili latar belakang linguistik atau budaya seseorang, skor standar dapat salah merepresentasikan kemampuan, menimbulkan pertanyaan lama tentang penggunaan tes acuan norma yang adil di berbagai populasi.

Key figures

  • Rebecca McCauley
  • Linda Swisher
  • Elena Plante
  • Tammie Spaulding
  • Anne Anastasi

Related topics

Seminal works

  • mccauley-swisher-1984
  • spaulding-2006
  • anastasi-urbina-1997

Frequently asked questions

Apa perbedaan antara penilaian acuan norma dan acuan kriteria?
Penilaian acuan norma membandingkan skor seseorang dengan distribusi sampel referensi untuk menunjukkan posisi relatif, sedangkan penilaian acuan kriteria membandingkan kinerja dengan keterampilan atau standar yang ditentukan terlepas dari bagaimana teman sebaya berkinerja.
Mengapa kesalahan standar pengukuran penting?
Karena tidak ada tes yang sepenuhnya reliabel, skor yang diperoleh adalah perkiraan; kesalahan standar pengukuran mengukur ketidakpastiannya dan merupakan alasan mengapa skor paling baik diinterpretasikan sebagai interval kepercayaan daripada titik-titik yang tepat, terutama di dekat batas diagnostik.

Methods for this concept

Related concepts