ばらつきの尺度
ばらつきの尺度、すなわち散布度は、一連の観測値がその中心の周りにどの程度広がっているかを定量化するものです。2つのデータセットが同じ平均値を持つ場合でも、その値がどの程度密に集まっているかには大きな違いがあり、範囲、分散、標準偏差、四分位範囲などの尺度は、その違いを捉えます。
Definition
ばらつきの尺度は、中心値の周りの観測値の広がりを定量化します。範囲は最大値と最小値の差であり、分散は平均からの偏差の二乗の平均であり、標準偏差は元の単位でのその平方根であり、四分位範囲は順序付けられたデータの中央半分が広がる範囲です。
Scope
この項目では、主要な散布度(範囲、分散、標準偏差、四分位範囲)と、それぞれの計算方法および解釈方法について説明します。標準偏差と標準誤差の違いを区別し、臨床的ガイダンスではなく、方法論的な参照としています。
Core questions
- 観測値は中心の周りにどの程度広く分布していますか?
- 選択された位置の尺度と適切に組み合わせられる散布度尺度はどれですか?
- 標準偏差は標準誤差とどのように異なりますか?
Key concepts
- 範囲
- 分散
- 標準偏差
- 四分位範囲
- 変動係数
- 標準偏差と標準誤差
- 散布度と中心傾向の組み合わせ
Mechanisms
極値間の差である範囲は単純ですが、2つの値のみに依存し、サンプルサイズとともに増加するため不安定です。分散は観測値の平均からの偏差の二乗を平均したものであり、標準偏差はその量を元の測定単位に戻すため、ほぼ対称なデータの場合には平均の自然な伴侶となります。25パーセンタイルから75パーセンタイルにわたる四分位範囲は、データの中央半分を記述し、外れ値に対して頑健であるため、歪んだ分布の場合には中央値の伴侶となります。混乱の繰り返し源となるのは、個々の観測値の広がりを記述する標準偏差と、平均などの推定値の精度を記述し、サンプルが増加するにつれて縮小する標準誤差との違いです。
Clinical relevance
散布度尺度は、測定値や結果がどの程度変動するかを読者に伝え、これは一貫性、参照範囲、および報告された推定値の精度を判断する上で重要です。この項目は、ばらつきが評価のためにどのように要約されるかを記述するものであり、個別の診断や治療の決定の根拠となるものではありません。
Epidemiology
中心傾向とともにばらつきを報告することは、健康研究における基本的な期待事項であり、標準偏差と標準誤差の区別は一般的な報告エラーです。これらを混同すると、推定値が実際よりも精密に見えたり、そうでないように見えたりする可能性があります。データが歪んでいる場合は、四分位範囲が好まれます。
History
分散と標準偏差は19世紀後半から20世紀初頭にかけて形式化され、標準偏差という用語はカール・ピアソンによって導入され、分散の分析的枠組みはロナルド・フィッシャーによって開発されました。頑健で分位数に基づく四分位範囲は、20世紀における探索的データ分析と箱ひげ図の台頭とともに重要性を増しました。
Debates
- 報告における標準偏差と標準誤差のどちらを使用すべきか?
- 著者は、数値的に小さいため、標準偏差の代わりに標準誤差を報告することがよくありますが、これは基礎となる観測値のばらつきについて読者を誤解させる可能性があります。方法論的ガイダンスでは、広がりを記述するために標準偏差を報告し、推定値の精度には標準誤差を留保することを強調しています。
Key figures
- Douglas G. Altman
- J. Martin Bland
- S. Manikandan
Related topics
Seminal works
- manikandan-2011-dispersion
- altman-bland-2005
Frequently asked questions
- 標準偏差と標準誤差の違いは何ですか?
- 標準偏差は個々の観測値が平均の周りにどの程度ばらつくかを記述するのに対し、標準誤差は平均自体がどの程度正確に推定されているかを記述します。標準誤差はサンプルサイズが増加すると減少しますが、標準偏差は減少しません。
- 標準偏差の代わりに四分位範囲を使用すべきなのはどのような場合ですか?
- データが歪んでいる場合や外れ値を含む場合、四分位範囲は中央値と同様に極端な値の影響を受けないため、ばらつきをより忠実に記述します。