標準化された検査と規範参照評価
標準化された検査と規範参照評価とは、固定された条件下で実施および採点される形式的な測定器の使用を指し、それによって個人の成績を代表的な参照(規範)サンプルから得られたスコアの分布と比較することができます。言語聴覚療法において、これらのツールは、適格性、重症度、および診断の決定を支援するために使用される標準スコア、パーセンタイル順位、および年齢等価物をもたらします。
Definition
規範参照検査とは、標準化された条件下で実施および採点され、個人の生得点と定義された規範サンプルからのスコア分布を比較することによって解釈される測定であり、通常、標準スコアまたはパーセンタイル順位として表現されます。
Scope
このトピックは、規範参照測定の論理、標準化の意味、検査の信頼性を決定する心理測定特性(信頼性、妥当性、規範的妥当性)、およびカットオフ基準の解釈と限界について扱います。これは、言語聴覚療法における評価の一つのモードとしての標準化された検査と、個人の検査方法ではなく、方法論的な主題として扱います。
Core questions
- 標準スコアは、個人を同輩と比較して実際に何を教えてくれるのでしょうか?
- 診断の指針となる前に、検査の規範サンプル、信頼性、妥当性はどの程度適切でなければならないのでしょうか?
- 診断的カットオフはどこに設定すべきであり、その選択は感度と特異度にどのように影響するのでしょうか?
- 規範参照検査が不適切なツールであるのはどのような場合で、それを補完すべきものは何でしょうか?
Key concepts
- 実施と採点の標準化
- 規範(参照)サンプル
- 標準スコア、パーセンタイル順位、年齢等価物
- 信頼性(再検査信頼性、内的整合性)
- 妥当性(構成概念、内容、基準)
- 感度、特異度、および診断的カットオフ
- 測定の標準誤差
- 規範参照と基準参照の解釈
Mechanisms
検査は、項目、実施手順、および採点規則を固定し、関心のある集団を代表するように選択された規範サンプルに実施することによって標準化されます。個人の生得点は、そのサンプルの分布を使用して、その人を同輩と比較する標準スコアまたはパーセンタイルに変換されます。この位置の解釈的価値は、検査の信頼性(測定の一貫性)、その妥当性(意図された構成概念を測定しているか)、および規範の代表性に依存します。診断的使用には決定規則が追加されます。それは、成績が障害と見なされるカットオフであり、その配置は感度と特異度(Spaulding, Plante, & Farinella, 2006)のトレードオフを支配します。
Clinical relevance
規範参照スコアは、サービスの適格性やコミュニケーション障害の文書化された重症度を決定することが多いため、その心理測定学的品質は、誰が特定されるかに直接的な影響を与えます。この項目では、そのようなスコアがどのように導き出され、解釈されるか、およびそれらが信頼できる条件について説明します。これは参照的な方向性であり、特定の人物をどのように検査または診断するかを規定するものではありません。
Evidence & guidelines
方法論的レビューでは、多くの公表されている言語および構音検査が、信頼性、妥当性、および規範的妥当性に関する基本的な心理測定学的基準を満たしていないことが繰り返し指摘されており、そのスコアに無批判に依拠することに対して警告を発しています(McCauley & Swisher, 1984)。適格性基準の分析によると、一般的なカットオフ(例えば、平均より1つ以上の標準偏差下の成績)は、検査の診断精度が異なるため、言語障害のある子供と典型的に発達している同輩を常に区別するわけではありません(Spaulding et al., 2006)。教育および心理学的検査の基準(Standards for Educational and Psychological Testing)は、検査開発、妥当性の証拠、および公正な使用に関する一般的な期待を定めています(AERA, APA, & NCME, 2014)。
History
コミュニケーション障害における規範参照検査は、アナスタシのような人物によって体系化されたより広範な心理測定運動と並行して、20世紀半ばに急速に拡大しました。1980年代には、言語および構音検査の普及が体系的な心理測定学的精査を促し(McCauley & Swisher, 1984)、その後の研究は、便利なカットオフから、文書化された診断精度と、標準化されたスコアと他の評価証拠の統合へと重点を移しました(Spaulding et al., 2006)。
Debates
- 従来のカットオフを下回る成績は、障害を診断するのに十分でしょうか?
- −1または−1.25標準偏差のような診断的カットオフは広く使用されていますが、その感度と特異度は検査によって異なります。単一の従来の閾値に依存すると、子供を過剰に特定したり、過少に特定したりする可能性があるため、カットオフは検査の測定された診断精度によって正当化されるべきです。
- 規範サンプルは多様な集団をどの程度代表しているのでしょうか?
- 規範サンプルが個人の言語的または文化的背景を代表していない場合、標準スコアは能力を誤って表現する可能性があり、集団間での規範参照検査の公正な使用に関する長年の疑問を提起しています。
Key figures
- Rebecca McCauley
- Linda Swisher
- Elena Plante
- Tammie Spaulding
- Anne Anastasi
Related topics
Seminal works
- mccauley-swisher-1984
- spaulding-2006
- anastasi-urbina-1997
Frequently asked questions
- 規範参照評価と基準参照評価の違いは何ですか?
- 規範参照評価は、個人のスコアを参照サンプルの分布と比較して相対的な位置を示すのに対し、基準参照評価は、同輩の成績に関係なく、定義されたスキルまたは基準に対して成績を比較します。
- 測定の標準誤差が重要なのはなぜですか?
- 完璧に信頼できる検査はないため、得られたスコアは推定値です。測定の標準誤差は、その不確実性を定量化するものであり、特に診断的カットオフ付近では、スコアが正確な点ではなく信頼区間として解釈されるのが最善である理由です。