통계적 검정력 및 표본 크기
통계적 검정력은 특정 크기의 효과가 실제로 존재할 때 연구가 그 효과를 감지할 확률입니다. 공식적으로는 제2종 오류율(Type II error rate)의 1에서 뺀 값입니다. 표본 크기 결정은 예상되는 효과 크기, 선택된 유의수준 및 데이터의 변동성을 고려하여 목표 검정력을 달성하는 데 필요한 참가자 수를 선택하는 계획 단계입니다. 이 두 가지는 연구가 질문에 대한 공정한 답변을 얻을 만큼 충분히 큰지 여부를 결정합니다.
Definition
통계적 검정력은 검정이 거짓인 귀무가설을 올바르게 기각할 확률(지정된 크기의 실제 효과를 감지할 확률)이며, 표본 크기 결정은 가정된 효과 크기와 변동성에 대해 주어진 유의수준에서 목표 검정력을 달성하는 데 필요한 관측치 수를 계산하는 것입니다.
Scope
이 주제는 검정력이 무엇을 의미하는지, 검정력 계산의 네 가지 상호 연관된 양(효과 크기, 유의수준, 검정력 및 표본 크기), 그리고 검정력이 부족한 연구의 결과를 설명합니다. 이는 임상적 의사결정 규칙이 아닌 연구 계획 및 평가를 위한 참조 방법론으로 제시됩니다.
Core questions
- 연구가 찾고 있는 효과를 감지할 가능성은 얼마나 됩니까?
- 목표 검정력에 도달하는 데 필요한 참가자 수는 몇 명입니까?
- 효과 크기, 변동성 및 유의수준은 표본 크기에 어떻게 영향을 미칩니까?
- 연구의 검정력이 부족할 때 어떤 문제가 발생합니까?
Key concepts
- 통계적 검정력 (1 - 베타)
- 효과 크기
- 유의수준 (알파)
- 변동성 및 표준편차
- 사전 표본 크기 계산
- 검정력 부족 연구
- 최소 임상적으로 중요한 차이
Mechanisms
검정력, 유의수준, 효과 크기 및 표본 크기는 서로 연결되어 있어 이 중 세 가지를 고정하면 네 번째가 결정됩니다. 주어진 유의수준에서 검정력은 실제 효과 크기가 커질수록, 변동성이 감소할수록, 그리고 표본 크기가 증가할수록 높아집니다. 표본 크기 계산은 이 관계를 역으로 적용합니다. 즉, 가정된 효과 크기(종종 감지할 가치가 있는 최소값), 선택된 유의수준 및 목표 검정력(일반적으로 80% 또는 90%)에서 시작하여 필요한 관측치 수를 계산합니다. 검정력 부족은 실제 효과를 놓칠 가능성(제2종 오류)을 높일 뿐만 아니라, 작은 연구에서는 크고 과장될 수 있는 추정치만이 임계값을 넘기 때문에 유의미한 결과가 과장되거나 거짓일 가능성을 높입니다.
Clinical relevance
시험이나 연구가 적절한 검정력을 가졌는지 여부는 그 결과를 어떻게 해석해야 하는지를 결정합니다. 검정력이 부족한 연구에서 유의미하지 않은 결과는 안심할 만한 것이라기보다는 대체로 정보가 부족하며, 표본 크기를 사전에 정당화하는 것은 연구 보고서의 필수 요소입니다. 이 항목은 평가 및 설계 목적을 위한 검정력 및 표본 크기 추론을 설명하며, 개별 진단 또는 치료 결정의 근거가 아닙니다.
Evidence & guidelines
임상 시험 및 관찰 연구에 대한 보고 표준은 사전 표본 크기 정당화를 요구하며, 방법론적 검토는 낮은 검정력으로 인한 광범위한 피해를 문서화했습니다. Button과 동료들은 만성적으로 검정력이 부족한 분야가 신뢰할 수 없는 문헌을 생산한다고 보여주었으며, Altman과 Bland, 그리고 Greenland와 동료들의 오해석 가이드는 낮은 검정력이 많은 정보 부족한 귀무 결과를 설명한다고 강조합니다.
History
검정력은 제2종 오류율을 정의한 Neyman-Pearson 검정 프레임워크의 직접적인 결과이며, 검정력은 이 오류율의 보완입니다. Jacob Cohen의 1960년대 이후 연구는 1988년 그의 저서에서 통합되었으며, 보건 및 행동 과학 전반에 걸쳐 체계적인 검정력 분석 및 효과 크기 관례를 대중화했습니다. 검정력 부족 연구에 대한 우려는 2010년대 재현성 논쟁에서 심화되었습니다.
Debates
- 만성적인 검정력 부족의 결과
- 지속적으로 낮은 검정력은 위음성(false negatives)을 증가시킬 뿐만 아니라 통계적으로 유의미한 결과가 실제 효과를 반영할 확률을 감소시키고 보고된 효과의 크기를 과장하여 전체 문헌의 신뢰성을 저해합니다.
Key figures
- Jacob Cohen
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
- John P. A. Ioannidis
Related topics
Seminal works
- cohen-1988
- button-2013
Frequently asked questions
- 간단히 말해 통계적 검정력이란 무엇입니까?
- 이는 특정 크기의 실제 효과가 실제로 존재할 경우 연구가 그 효과를 감지할 확률입니다. 검정력이 높을수록 실제 효과를 놓치지 않을 가능성이 높아지며, 80%의 검정력이 일반적인 목표입니다.
- 표본 크기가 왜 그렇게 중요합니까?
- 표본 크기가 클수록 검정력이 증가하고 추정치의 정밀도가 높아져 연구가 찾고 있는 효과를 신뢰할 수 있게 감지할 수 있습니다. 표본이 너무 작으면 실제 효과를 놓치거나 과장된 유의미한 결과를 초래할 위험이 있습니다.