정규 분포
정규 분포는 가우스 분포 또는 종형 곡선이라고도 불리며, 평균에 대해 대칭적이고 평균과 표준편차에 의해 완전히 설명되는 연속 분포입니다. 많은 측정값이 정규 분포에 근사하고 표본 평균이 정규 분포를 따르는 경향이 있어 대부분의 표준 추론의 기초가 되므로 생물통계학에서 가장 중요한 분포입니다.
Definition
정규 분포는 평균(중심)과 표준편차(분산)라는 두 매개변수에 의해 전적으로 결정되는 대칭적인 종형 밀도를 가진 연속 확률 분포입니다.
Scope
이 항목은 정규 분포의 형태와 매개변수, 표준편차와 포함 범위를 연결하는 경험적 규칙, 표준 정규 분포와 z-점수, 참고 범위, 그리고 개별 개체의 정규 분포와 표본 평균의 정규 분포 간의 구별을 다룹니다. 이는 방법론적 참고 자료이며 개별 환자에 대한 임상적 임계값을 제공하지 않습니다.
Core questions
- 정규 분포는 어떤 형태를 가지며 무엇이 이를 결정하는가?
- 주어진 표준편차 수 내에 분포의 얼마나 많은 부분이 놓여 있는가?
- z-점수란 무엇이며 표준화는 어떻게 작동하는가?
- 정규성을 가정하는 것이 적절한 경우는 언제인가?
Key concepts
- 평균과 표준편차
- 대칭성과 종형
- 경험적 (68-95-99.7) 규칙
- 표준 정규 분포
- z-점수와 표준화
- 참고 범위
- 왜도와 정규성으로부터의 이탈
Mechanisms
정규 분포는 두 가지 숫자에 의해 결정됩니다: 분포의 중심을 나타내는 평균과 너비를 설정하는 표준편차입니다. 대략 68%의 값은 평균의 1 표준편차 이내에, 약 95%는 2 표준편차 이내에, 그리고 약 99.7%는 3 표준편차 이내에 분포합니다. 이는 분포의 실용적인 유용성을 제공하는 경험적 규칙입니다. 모든 정규 변수는 평균을 빼고 표준편차로 나누어 표준 정규 분포(평균 0, 표준편차 1)를 따르는 z-점수로 표준화할 수 있으며, 이를 통해 단일 표 또는 공식 세트가 모든 정규 분포에 적용될 수 있습니다. 의학 연구에서 혈액 값과 같은 측정값에 대한 참고 범위는 종종 가정된 정규 분포의 중앙 95%에서 구성되며, 많은 통계 테스트는 데이터 또는 통계량의 표본 분포가 대략적으로 정규 분포를 따른다고 가정합니다.
Clinical relevance
많은 생물학적 측정값은 대략적인 정규성 가정 하에 요약되고 비교되며, 참고 범위는 종종 이를 기반으로 구축되므로, 분포를 이해하는 것은 실험실 및 연구 결과의 해석에 도움이 됩니다. 이 항목은 분포를 방법론으로 설명하며 개개인에 대한 진단적 기준점을 설정하지 않습니다.
History
종형 곡선은 18세기에 드 무아브르(de Moivre)의 이항 분포 근사에서 나타났으며 라플라스(Laplace)와 가우스(Gauss)에 의해 발전되었습니다. 가우스는 이를 측정 오차 분석에 사용했으며, 이 때문에 종종 가우스 분포라고 불립니다. 19세기와 20세기를 거쳐 측정된 생물학적 양의 기본 모델이자 고전 통계 추론의 초석이 되었습니다.
Debates
- 정규성 가정이 오해를 불러일으키는 경우는 언제인가?
- 많은 생물학적 변수는 대칭적이기보다는 비대칭적이며, 이를 정규 분포로 취급하면 참고 범위와 검사를 왜곡할 수 있습니다. 데이터를 변환할지, 분포에 구애받지 않는 방법을 사용할지, 또는 평균에 대한 중심 극한 정리에 의존할지는 반복되는 방법론적 판단 문제입니다.
Key figures
- Carl Friedrich Gauss
- Pierre-Simon Laplace
- Abraham de Moivre
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
Frequently asked questions
- 68-95-99.7 규칙이란 무엇인가?
- 정규 분포의 경우, 값의 약 68%는 평균의 1 표준편차 이내에, 약 95%는 2 표준편차 이내에, 그리고 약 99.7%는 3 표준편차 이내에 놓입니다. 이 경험적 규칙은 표준편차를 포함된 값의 비율과 직접 연결합니다.
- 추론에서 정규 분포를 사용하기 위해 데이터가 반드시 정규 분포를 따라야 하는가?
- 항상 그런 것은 아닙니다. 많은 방법은 중심 극한 정리에 의해 평균의 표본 분포가 대략적으로 정규 분포를 따른다는 점에 의존하며, 이는 개별 측정값이 정규 분포를 따르지 않더라도 표본 크기가 충분히 크면 성립할 수 있습니다.