ScholarGate
アシスタント

データ記述と要約統計量

データ記述と要約統計量とは、生物統計学の一部であり、観察結果の集合を整理、要約し、その本質的な特徴が一目で把握できるように提示することに関わります。推論を試みる前に、研究者は数値要約と図形表示を用いて、データがどのように分布しているか、どこに中心があるか、どの程度広く散らばっているか、どのような形状をしているかを記述します。

PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
スライドをダウンロード
Learn & explore
動画近日公開

Definition

データ記述と要約統計量とは、母集団への推論的一般化に先行し、それとは独立して、データセットの中心位置、散らばり、分布形状、および構造を特徴づけるために使用される数値的および図形的分析手法を指します。

Scope

この分野は、生物統計学の記述的側面、すなわち記述統計学全体、データの分布と正規性、中心傾向の尺度、ばらつきの尺度、およびデータ視覚化について読者に説明します。これは、健康データがどのように要約されるかについての参照的概観であり、分析や臨床的行動の処方箋ではありません。

Sub-topics

Core questions

  • データの中心はどこにあり、どの位置の尺度がそれを最もよく表していますか?
  • 観測値はどの程度ばらついており、その広がりはどのように定量化されますか?
  • 分布の形状はどのようなもので、およそ正規分布ですか?
  • データのパターン、歪度、外れ値が見えるように、どのようにデータを表示できますか?

Key concepts

  • 記述統計と推測統計
  • 中心傾向の尺度(平均、中央値、最頻値)
  • ばらつきの尺度(範囲、分散、標準偏差、四分位範囲)
  • 分布の形状、歪度、尖度
  • 正規性とその評価
  • 図形要約(ヒストグラム、箱ひげ図、散布図)
  • 探索的データ解析

Mechanisms

記述は、多くの観察結果を少数の情報量の多い量と図に還元することによって進められます。位置の尺度(平均、中央値、最頻値)はデータがどこに位置するかを要約し、ばらつきの尺度(標準偏差、四分位範囲、範囲)はデータがその位置の周りにどの程度散らばっているかを要約します。そして、位置とばらつきの組み合わせは分布の形状に合わせて選択され、歪んだデータには中央値と四分位範囲が、ほぼ対称なデータには平均と標準偏差が好まれます。ヒストグラムや箱ひげ図などの図形表示は、単一の数値では隠されがちな形状、歪度、外れ値を示し、これらのツールは合わせて、正式な推論に先行する探索的段階を形成します。

Clinical relevance

ほとんどすべての臨床研究、監査、およびサーベイランス報告書は、参加者と測定値の記述的要約から始まるため、これらの要約を理解することは、健康科学文献を読む上で不可欠です。この分野は、データがどのように特徴づけられるかを記述しており、エビデンス評価の背景として意図されており、個々の診断や治療の決定の根拠となるものではありません。

Epidemiology

記述的要約は、疫学研究および臨床研究における最初の分析ステップであり、関連性を推定する前に、研究集団、ベースライン表、曝露と結果の分布を特徴づけるために使用されます。要約尺度と表示の選択は、研究データがどの程度透明に伝達されるかに直接影響します。

History

データの数値的要約は、18世紀および19世紀の天文学と生命統計学に深いルーツを持っていますが、現代の記述的ツールキットは20世紀に統合されました。ジョン・テューキーの『探索的データ解析』(1977年)は、記述をそれ自体が調査活動であると再定義し、箱ひげ図などの表示を普及させました。その後、健康科学分野の統計教育者たちは、現在医学雑誌で報告されている標準的な要約を体系化しました。

Debates

平均と標準偏差を中央値と四分位範囲に切り替えるべきなのはいつですか?
平均と標準偏差は歪度と外れ値に引っ張られるため、非正規データを中央値と四分位範囲で要約するという長年の推奨があります。切り替えの実用的な閾値は、分布の形状とサンプルサイズに依存します。

Key figures

  • John W. Tukey
  • William S. Cleveland
  • Douglas G. Altman
  • J. Martin Bland

Related topics

Seminal works

  • tukey-1977
  • gupta-2019

Frequently asked questions

記述統計と推測統計の違いは何ですか?
記述統計は実際に収集されたデータを要約し表示するのに対し、推測統計はそれらのデータを用いてより広範な母集団に関する一般化を行います。記述は最初に行われ、手元のサンプルを超える確率的な主張は行いません。
テストを実行する前にデータを記述するのはなぜですか?
要約とプロットは、分布の形状、広がり、および外れ値やエラーを明らかにし、それらが後の分析が適切であるかどうか、およびその結果をどのように解釈すべきかを決定します。

Methods for this concept

Related concepts