결측 데이터 및 중도 탈락
결측 데이터는 수집될 예정이었으나 얻지 못한 값이며, 중도 탈락은 연구 과정에서 참가자가 이탈하거나 추적 관찰이 불가능해지는 현상입니다. 이 둘은 모두 사용 가능한 정보의 양을 감소시키고, 더 심각하게는 어떤 값이 결측될 확률이 그 값 자체와 관련이 있을 때 결과에 편향을 초래할 수 있습니다. 설계 단계에서 결측을 예측하고 제한하며, 분석에서 이를 적절하게 처리하는 것은 연구의 타당성을 유지하는 데 필수적입니다.
Definition
결측 데이터는 기록되지 않은 의도된 관측치이며, 중도 탈락은 연구 중 등록된 참가자의 손실입니다. 이들의 영향은 결측 메커니즘에 따라 달라지는데, 완전 무작위 결측(어떤 데이터와도 무관함)부터 무작위 결측(관측된 데이터로 설명 가능함)을 거쳐 비무작위 결측(관측되지 않은 값 자체와 관련됨)까지 다양합니다.
Scope
이 항목은 결측 유형(완전 무작위 결측, 무작위 결측, 비무작위 결측), 편향 및 검정력에 대한 중도 탈락의 결과, 설계 및 수행에 포함된 예방 전략, 그리고 다중 대체 및 의도-대-치료 접근법과 같은 원칙적인 처리 방법을 다룹니다. 이는 방법론적 참고 자료로 구성되며 임상적 지침을 제공하지 않습니다.
Key concepts
- 완전 무작위 결측 (MCAR)
- 무작위 결측 (MAR)
- 비무작위 결측 (MNAR)
- 추적 관찰 손실 및 중도 탈락
- 다중 대체
- 의도-대-치료 분석
- 완전 사례 분석 및 그 편향
- 결측 가정에 대한 민감도 분석
Mechanisms
결측 데이터로 인한 위협은 값이 결측된 이유에 따라 달라집니다. 결측이 어떤 데이터와도 무관하다면(MCAR), 단순 분석은 정밀도를 잃지만 편향되지 않습니다. 만약 관측된 변수로 완전히 설명될 수 있다면(MAR), 다중 대체와 같은 방법은 관측된 값으로부터 결측 값을 모델링하여 유효한 추정치를 복구할 수 있습니다. 만약 관측되지 않은 값 자체에 의존한다면(MNAR), 어떤 방법도 편향 없는 결과를 보장할 수 없으며 결론은 검증 불가능한 가정에 달려 있습니다. 치료 또는 예후와 관련된 중도 탈락은 무작위 배정이 생성한 균형을 깨뜨릴 수 있습니다. 이것이 의도-대-치료 분석이 참가자를 할당된 그룹에 유지하는 이유이며, 사후 수정보다는 예방이 강조되는 이유입니다. 민감도 분석은 결측에 대한 다른 가정 하에서 결론이 어떻게 변하는지 조사합니다.
Clinical relevance
결측된 양, 이유, 그리고 처리 방법을 평가하는 것은 연구 결과의 신뢰성을 판단하는 데 중요합니다. 왜냐하면 높거나 차등적인 중도 탈락은 효과를 과장하거나 가릴 수 있기 때문입니다. 이 항목은 평가를 위한 연구 방법론을 설명하며 진단 또는 치료 지침의 출처가 아닙니다.
Evidence & guidelines
미국 식품의약국(FDA)을 위해 소집된 전문가 패널은 시험 설계 및 수행을 통한 결측 데이터 예방을 강조했으며, 단일 분석적 해결책에 의존하는 것에 대해 경고했습니다. 방법론적 지침은 무작위 결측 가정 하의 다중 대체와 그 함정, 그리고 결측 결과가 있는 시험을 위한 의도-대-치료 프레임워크를 설명합니다. CONSORT와 같은 보고 표준은 손실을 문서화하는 참가자 흐름도를 요구합니다. 설문 조사에 따르면 의도-대-치료는 실제 적용에서 종종 일관성 없이 정의되고 적용됩니다.
History
현대적 프레임워크는 Rubin의 1970년대 결측 메커니즘 공식화와 Little 및 Rubin의 후속 결측 데이터 통계 분석 작업(다중 대체를 도입)에 의해 형성되었습니다. 무작위 배정 시험이 발전함에 따라 의도-대-치료 원칙은 무작위 배정을 깨뜨리지 않고 중도 탈락을 처리하는 데 핵심이 되었습니다. 2010년 미국 국립연구위원회 보고서와 관련 FDA 위임 패널은 나중에 결측 데이터를 사후 통계적 수정보다는 설계에 의한 예방 문제로 재구성했습니다.
Debates
- 상당한 결측 데이터가 있는 연구를 다중 대체로 구할 수 있는가?
- 다중 대체는 데이터가 무작위로 결측되었을 때 유효한 추론을 제공하지만, 그 타당성은 데이터로부터 검증할 수 없는 가정에 기반합니다. 데이터가 비무작위로 결측되었을 때는 오해를 불러일으킬 수 있으므로, 보장된 해결책이라기보다는 민감도 분석과 함께 사용해야 하는 도구입니다.
- 의도-대-치료는 결측 결과를 어떻게 처리해야 하는가?
- 의도-대-치료는 무작위 배정된 그룹의 균형을 유지하기 위해 참가자를 해당 그룹에 유지하지만, 결과가 결측되었을 때는 결측 값에 대한 가정 없이는 적용할 수 없습니다. 이 원칙을 대체 및 민감도 분석과 결합하는 방법은 여전히 실질적인 과제로 남아 있습니다.
Key figures
- Roderick Little
- Donald Rubin
- Ian White
- Jonathan Sterne
- Douglas Altman
Related topics
Seminal works
- little-2012-prevention
- sterne-2009-mi
- white-2011-itt
Frequently asked questions
- 데이터가 결측된 이유가 결측된 양보다 더 중요한 이유는 무엇인가요?
- 결측될 확률이 관측되지 않은 값에 따라 달라진다면 적은 양의 결측 데이터도 결과에 편향을 초래할 수 있는 반면, 값과 무관한 이유로 결측된 데이터는 주로 정밀도를 감소시킬 뿐입니다. 편향이 발생하는지 여부와 정도는 양뿐만 아니라 메커니즘에 의해 결정됩니다.
- 의도-대-치료 분석이란 무엇이며, 중도 탈락에 왜 중요한가요?
- 의도-대-치료는 참가자가 무작위 배정된 그룹에서 분석하는 것으로, 그 이후에 어떤 일이 일어났는지와 관계없이 무작위 배정이 생성한 균형을 유지합니다. 중도 탈락에 중요한 이유는 중도 탈락자를 제외하거나 치료를 완료한 사람만 분석하면 무작위 배정이 제거했던 교란 요인이 다시 발생할 수 있기 때문입니다.