研究设计与样本量规划
研究设计和样本量规划是生物统计学中关注数据收集前所做决策的部分:如何选择和比较参与者,如何分配暴露或干预措施,研究需要多大规模才能可靠地回答其问题,以及如何预测可预见的损失(如失访)。这些选择为后续分析所能得出的结论设定了上限,这就是流行病学家将设计视为有效推断基础的原因。
Definition
研究设计和样本量规划是一套数据收集前的方法,它规定了如何抽样和比较受试者,如何分配治疗或暴露,需要多少受试者才能获得足够的功效,以及如何处理预期的数据损失,从而使所得研究能够支持有效和精确的结论。
Scope
本领域旨在引导读者了解定量健康研究的规划阶段。它将数据收集前决定研究内部有效性和精确度的主题归类:计算所需的样本量和统计功效、通过匹配和分层控制混杂、通过随机化和区组化平衡比较组,以及规划缺失数据和减员。它将这些视为方法学参考主题而非临床指导,并与生物统计学的分析阶段领域并列。
Sub-topics
Core questions
- 如何形成比较组,使其仅在感兴趣的暴露或干预方面存在差异?
- 需要多少参与者才能以可接受的功效和错误率检测到给定大小的效应?
- 哪些设计方法(匹配、分层、随机化、区组化)最能控制当前问题的混杂?
- 如何提前预防、最小化和处理缺失数据和参与者减员?
Key concepts
- 内部有效性
- 统计功效和I/II型错误
- 效应大小和最小临床重要差异
- 通过设计控制混杂
- 随机化和分配隐藏
- 分层和匹配
- 减员和意向性治疗规划
Mechanisms
设计通过塑造数据生成过程来发挥作用,从而使所进行的比较公平。随机化使治疗组在预期上可互换,消除了测量和未测量因素造成的混杂;匹配和分层消除了或控制了特定因素造成的混杂;区组化则使组大小在时间上保持平衡。样本量规划随后将设计与问题定量地联系起来,将目标效应大小、可接受的显著性水平和所需的功效转化为所需的受试者数量,并根据预期的减员进行调整。提前规划缺失数据可以保持这些方法旨在确保的有效性。
Clinical relevance
临床医生和政策制定者所依赖的证据质量主要在设计阶段确定,因此理解这些方法对于评估研究结论是否可信至关重要。本领域描述了如何规划和生成可靠证据;它是批判性评估和研究方法学的参考,而非诊断或治疗指导的来源。
Evidence & guidelines
报告指南规范了良好的设计实践:《CONSORT 2010声明》及其解释文件为试验中随机化、样本量和参与者流程(包括损失)的报告方式设定了期望。普通医学文献中的方法学综述,如《柳叶刀》流行病学系列,提供了关于设计选择如何保护有效性的易懂说明,而《现代流行病学》等标准教科书则提供了基础框架。
History
现代研究设计源于R. A. Fisher在20世纪初的农业实验,他引入了随机化、重复和区组化,也源于20世纪中叶的临床和慢性病流行病学,其中随机对照试验和观察性设计得到了形式化。随着Neyman-Pearson假设检验框架的采用,功效和样本量计算进入常规实践,而CONSORT等报告标准后来巩固了对这些设计元素如何规划和披露的期望。
Key figures
- Kenneth Schulz
- David Grimes
- Douglas Altman
- Kenneth Rothman
- Sander Greenland
Related topics
Seminal works
- moher-2010-consort
- schulz-grimes-2002-sampsize
- rothman-2008-me
Frequently asked questions
- 为什么研究设计被认为比统计分析更重要?
- 分析只能描述设计产生的数据;有缺陷的设计(不公平的比较、受试者过少或计划外的损失)会引入偏差或不精确性,任何后续分析都无法完全修复,因此数据收集前所做的决策在很大程度上决定了可以得出什么结论。
- 本领域下归类的主题有何特点?
- 它们都涉及数据收集前做出的选择:研究应该有多大(样本量),如何形成可比较的组(匹配、分层、随机化、区组化),以及如何规划不完整数据(缺失数据和减员)。