ScholarGate
Trợ lý

Kiểm định Tâm lý và Tâm trắc học

Tâm trắc học là khoa học đo lường các thuộc tính tâm lý: cách thức xây dựng các bài kiểm tra, cách định lượng điểm số của chúng, và cách thiết lập độ tin cậy, giá trị và sự công bằng để một con số thu được từ một bài kiểm tra có thể được diễn giải một cách tự tin.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Tâm trắc học là một nhánh của tâm lý học liên quan đến lý thuyết và kỹ thuật đo lường tâm lý, bao gồm thiết kế, thực hiện, chấm điểm và xác nhận các bài kiểm tra cũng như các mô hình thống kê liên hệ điểm số quan sát được với các thuộc tính cơ bản.

Scope

Chủ đề này bao gồm lý thuyết và các phương pháp biến các phản hồi thành điểm số có thể diễn giải: lý thuyết kiểm định cổ điển và mô hình điểm thực, độ tin cậy và sai số đo lường, khung giá trị, phân tích cấp độ mục, chuẩn hóa và tiêu chuẩn hóa, và sự công bằng của kiểm định. Đây là một mục phương pháp luận về đo lường, không phải hướng dẫn về việc lựa chọn hoặc chấm điểm các bài kiểm tra cho bất kỳ cá nhân nào.

Core questions

  • Bao nhiêu phần trăm điểm số quan sát được phản ánh thuộc tính so với sai số đo lường?
  • Cần bằng chứng gì trước khi một điểm số có thể được diễn giải là đo lường một cấu trúc dự định?
  • Các mục kiểm tra được phân tích, lựa chọn và định tỷ lệ như thế nào?
  • Làm thế nào để các điểm số có thể so sánh được giữa các cá nhân thông qua các chuẩn mực và tiêu chuẩn hóa?

Key concepts

  • Điểm thực và sai số đo lường
  • Độ tin cậy (nhất quán nội bộ, kiểm tra lại-kiểm tra lại, giữa các người đánh giá)
  • Giá trị nội dung, tiêu chí và cấu trúc
  • Phân tích mục và độ khó/khả năng phân biệt
  • Chuẩn mực, tiêu chuẩn hóa và điểm chuẩn
  • Lý thuyết phản hồi mục
  • Bất biến đo lường và sự công bằng của kiểm định

Key theories

Lý thuyết kiểm định cổ điển
Lý thuyết kiểm định cổ điển mô hình hóa một điểm số quan sát được là tổng của một điểm số thực và sai số ngẫu nhiên, từ đó độ tin cậy được định nghĩa là tỷ lệ phương sai điểm quan sát được quy cho phương sai điểm thực; Lord và Novick đã đưa ra công thức thống kê chặt chẽ cho lĩnh vực này.
Giá trị cấu trúc thống nhất
Cronbach và Meehl đã định khung giá trị xung quanh cấu trúc mà một bài kiểm tra suy luận, và Messick đã thống nhất bằng chứng nội dung, tiêu chí và cấu trúc thành một lập luận duy nhất về sự biện minh và hậu quả của việc diễn giải điểm số.

Mechanisms

Trong mô hình cổ điển, một điểm số quan sát được coi là một điểm số thực cộng với sai số ngẫu nhiên, và độ tin cậy định lượng phần phương sai là phương sai điểm thực; Lord và Novick đã chính thức hóa điều này và các mô hình phản hồi mục sau này. Giá trị là sự đảm bảo rằng một điểm số hỗ trợ một suy luận dự định: Cronbach và Meehl đã đặt nó trong cấu trúc và mạng lưới nomological của nó, Haynes và các đồng nghiệp đã chi tiết hóa giá trị nội dung như sự phù hợp có hệ thống của các mục với miền mục tiêu, và Messick đã thống nhất các loại bằng chứng thành một lập luận cũng cân nhắc các hậu quả của việc diễn giải. Các chuẩn mực và tiêu chuẩn hóa làm cho điểm số có thể so sánh được bằng cách tham chiếu chúng đến một quần thể xác định.

Clinical relevance

Các đặc tính tâm trắc học xác định liệu điểm số kiểm tra lâm sàng có đáng tin cậy hay không và ý nghĩa của nó có thể là gì, vì vậy bằng chứng về độ tin cậy và giá trị là nền tảng cho mọi việc sử dụng kiểm định có thể bảo vệ được trong tâm lý học lâm sàng. Mục này giải thích các đặc tính đó như các khái niệm đo lường; nó không khuyến nghị các công cụ cụ thể hoặc ngưỡng cắt cho bất kỳ người nào.

Evidence & guidelines

Các Tiêu chuẩn về Kiểm định Giáo dục và Tâm lý (The Standards for Educational and Psychological Testing) hệ thống hóa các kỳ vọng về độ tin cậy, giá trị và sự công bằng trong phát triển và sử dụng kiểm định. Cronbach và Meehl, Messick, và Haynes cùng các đồng nghiệp là các tài liệu tham khảo phương pháp luận tiêu chuẩn cho khung giá trị, và Lord và Novick là tuyên bố kinh điển về lý thuyết kiểm định cổ điển và phản hồi mục.

History

Đo lường tinh thần xuất hiện từ công trình nghiên cứu về sự khác biệt cá nhân vào thế kỷ XIX và được hệ thống hóa thành lý thuyết kiểm định cổ điển vào nửa đầu thế kỷ XX. Bài báo năm 1955 của Cronbach và Meehl đã đưa giá trị cấu trúc trở thành trung tâm, chuyên khảo năm 1968 của Lord và Novick đã cung cấp cho lĩnh vực này một nền tảng thống kê và phản hồi mục chặt chẽ, và tổng hợp sau này của Messick đã thống nhất khái niệm giá trị xung quanh sự biện minh của các suy luận và hậu quả xã hội của chúng.

Debates

Giá trị là một thuộc tính của các bài kiểm tra hay của các suy luận?
Lĩnh vực này phần lớn đã chuyển từ việc nói về các bài kiểm tra có giá trị sang việc xác nhận các suy luận và cách sử dụng được rút ra từ điểm số, với cuộc thảo luận tiếp tục về mức độ các hậu quả của việc kiểm định thuộc về khái niệm giá trị.

Key figures

  • Lee Cronbach
  • Paul Meehl
  • Samuel Messick
  • Frederic Lord
  • Melvin Novick

Related topics

Seminal works

  • cronbach-meehl-1955
  • lord-novick-1968
  • messick-1995

Frequently asked questions

Sự khác biệt giữa độ tin cậy và giá trị là gì?
Độ tin cậy là sự nhất quán của một phép đo (mức độ ít bị ảnh hưởng bởi sai số ngẫu nhiên), trong khi giá trị là liệu suy luận rút ra từ một điểm số có được biện minh hay không; một bài kiểm tra có thể đáng tin cậy mà không có giá trị cho một mục đích nhất định, nhưng nó không thể có giá trị mà không đáng tin cậy một cách hợp lý.
Giá trị cấu trúc có nghĩa là gì?
Đó là mức độ mà một bài kiểm tra có thể được diễn giải là đo lường một thuộc tính dự định, được định nghĩa theo lý thuyết, được thiết lập bằng cách tích lũy bằng chứng rằng bài kiểm tra liên quan đến các biến khác như lý thuyết dự đoán.

Methods for this concept

Related concepts