ScholarGate
Trợ lý

Các Thước Đo Độ Biến Thiên

Các thước đo độ biến thiên, hay độ phân tán, định lượng mức độ phân tán của một tập hợp các quan sát xung quanh giá trị trung tâm của nó. Hai tập dữ liệu có thể có cùng giá trị trung bình nhưng khác nhau đáng kể về mức độ tập trung của các giá trị, và các thước đo như khoảng biến thiên, phương sai, độ lệch chuẩn và khoảng tứ phân vị nắm bắt được sự khác biệt đó.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Một thước đo độ biến thiên định lượng sự phân tán của các quan sát xung quanh một giá trị trung tâm: khoảng biến thiên là hiệu số giữa giá trị lớn nhất và nhỏ nhất, phương sai là bình phương độ lệch trung bình so với giá trị trung bình, độ lệch chuẩn là căn bậc hai của nó theo đơn vị gốc, và khoảng tứ phân vị là độ phân tán của nửa giữa của dữ liệu đã được sắp xếp.

Scope

Mục này bao gồm các thước đo độ phân tán chính — khoảng biến thiên, phương sai, độ lệch chuẩn và khoảng tứ phân vị — cũng như cách tính toán và diễn giải từng thước đo. Nó phân biệt độ lệch chuẩn với sai số chuẩn và là một tài liệu tham khảo về phương pháp luận, không phải hướng dẫn lâm sàng.

Core questions

  • Các quan sát phân tán rộng đến mức nào xung quanh giá trị trung tâm của chúng?
  • Thước đo độ phân tán nào phù hợp với thước đo vị trí đã chọn?
  • Độ lệch chuẩn khác với sai số chuẩn như thế nào?

Key concepts

  • Khoảng biến thiên
  • Phương sai
  • Độ lệch chuẩn
  • Khoảng tứ phân vị
  • Hệ số biến thiên
  • Độ lệch chuẩn so với sai số chuẩn
  • Ghép nối độ phân tán với xu hướng trung tâm

Mechanisms

Khoảng biến thiên, khoảng cách giữa các giá trị cực đoan, đơn giản nhưng không ổn định vì nó chỉ phụ thuộc vào hai giá trị và tăng theo kích thước mẫu. Phương sai tính trung bình các bình phương độ lệch của các quan sát so với giá trị trung bình, và độ lệch chuẩn đưa đại lượng đó về đơn vị đo lường ban đầu, làm cho nó trở thành thước đo tự nhiên đi kèm với giá trị trung bình cho dữ liệu gần đối xứng. Khoảng tứ phân vị, trải dài từ phân vị thứ 25 đến 75, mô tả nửa giữa của dữ liệu và mạnh mẽ trước các giá trị ngoại lai, làm cho nó trở thành thước đo đi kèm với trung vị cho các phân phối lệch. Một nguồn gây nhầm lẫn thường xuyên là sự khác biệt giữa độ lệch chuẩn, mô tả sự phân tán của các quan sát cá nhân, và sai số chuẩn, mô tả độ chính xác của một ước tính như giá trị trung bình và giảm khi kích thước mẫu tăng lên.

Clinical relevance

Các thước đo độ phân tán cho người đọc biết mức độ biến thiên của một phép đo hoặc kết quả, điều này quan trọng để đánh giá tính nhất quán, các khoảng tham chiếu và độ chính xác của các ước tính được báo cáo. Mục này mô tả cách độ biến thiên được tóm tắt để đánh giá và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.

Epidemiology

Báo cáo độ biến thiên cùng với xu hướng trung tâm là một kỳ vọng cơ bản trong nghiên cứu sức khỏe, và sự phân biệt giữa độ lệch chuẩn và sai số chuẩn là một lỗi báo cáo phổ biến: nhầm lẫn chúng có thể làm cho các ước tính trông chính xác hơn hoặc kém chính xác hơn so với thực tế. Khoảng tứ phân vị được ưu tiên khi dữ liệu bị lệch.

History

Phương sai và độ lệch chuẩn được chính thức hóa vào cuối thế kỷ XIX và đầu thế kỷ XX, với thuật ngữ độ lệch chuẩn được Karl Pearson giới thiệu và khung phân tích phương sai được Ronald Fisher phát triển. Khoảng tứ phân vị mạnh mẽ, dựa trên phân vị, trở nên nổi bật với sự phát triển của phân tích dữ liệu thăm dò và biểu đồ hộp (box plot) vào thế kỷ XX.

Debates

Nên báo cáo độ lệch chuẩn hay sai số chuẩn?
Các tác giả thường báo cáo sai số chuẩn thay vì độ lệch chuẩn vì nó nhỏ hơn về mặt số học, điều này có thể gây hiểu lầm cho người đọc về sự biến thiên của các quan sát cơ bản; hướng dẫn phương pháp luận nhấn mạnh việc báo cáo độ lệch chuẩn để mô tả sự phân tán và dành sai số chuẩn cho độ chính xác của các ước tính.

Key figures

  • Douglas G. Altman
  • J. Martin Bland
  • S. Manikandan

Related topics

Seminal works

  • manikandan-2011-dispersion
  • altman-bland-2005

Frequently asked questions

Sự khác biệt giữa độ lệch chuẩn và sai số chuẩn là gì?
Độ lệch chuẩn mô tả mức độ biến thiên của các quan sát cá nhân xung quanh giá trị trung bình, trong khi sai số chuẩn mô tả mức độ chính xác của chính giá trị trung bình được ước tính. Sai số chuẩn giảm khi kích thước mẫu tăng lên; độ lệch chuẩn thì không.
Khi nào nên sử dụng khoảng tứ phân vị thay vì độ lệch chuẩn?
Khi dữ liệu bị lệch hoặc chứa các giá trị ngoại lai, khoảng tứ phân vị mô tả sự phân tán một cách trung thực hơn vì, giống như trung vị, nó không bị ảnh hưởng bởi các giá trị cực đoan.

Methods for this concept

Related concepts