Планирование дизайна исследования и размера выборки
Планирование дизайна исследования и размера выборки является частью биостатистики, занимающейся решениями, принимаемыми до сбора каких-либо данных: как отбираются и сравниваются участники, как распределяются воздействия или вмешательства, насколько большим должно быть исследование, чтобы надежно ответить на поставленный вопрос, и как предвидеть возможные потери, такие как выбывание участников. Эти решения определяют пределы того, что может быть заключено в любом последующем анализе, поэтому эпидемиологи рассматривают дизайн как основу для обоснованных выводов.
Definition
Планирование дизайна исследования и размера выборки — это совокупность методов, применяемых до сбора данных, которые определяют, как отбираются и сравниваются субъекты, как распределяются методы лечения или воздействия, сколько субъектов необходимо для адекватной мощности и как обрабатываются ожидаемые потери данных, чтобы полученное исследование могло обеспечить обоснованные и точные выводы.
Scope
Эта область знакомит читателей с этапом планирования количественных исследований в области здравоохранения. Она объединяет темы, которые определяют внутреннюю валидность и точность исследования до сбора данных: расчет необходимого размера выборки и статистической мощности, сопоставление и стратификация для контроля смешивающих факторов, рандомизация и блокировка для балансировки сравниваемых групп, а также планирование на случай отсутствующих данных и выбывания участников. Она рассматривает эти вопросы как методологические справочные темы, а не как клинические инструкции, и находится рядом с областями биостатистики, связанными с этапом анализа.
Sub-topics
Core questions
- Как следует формировать сравниваемые группы, чтобы они различались только по интересующему воздействию или вмешательству?
- Сколько участников необходимо для обнаружения эффекта заданного размера с приемлемой мощностью и частотой ошибок?
- Какие методы дизайна (сопоставление, стратификация, рандомизация, блокировка) наилучшим образом контролируют смешивающие факторы для рассматриваемого вопроса?
- Как будут предотвращаться, минимизироваться и учитываться заранее отсутствующие данные и выбывание участников?
Key concepts
- Внутренняя валидность
- Статистическая мощность и ошибки I/II типа
- Размер эффекта и минимально клинически значимая разница
- Контроль смешивающих факторов посредством дизайна
- Рандомизация и сокрытие распределения
- Стратификация и сопоставление
- Выбывание и планирование по принципу «намерение лечить»
Mechanisms
Дизайн работает путем формирования процесса генерации данных таким образом, чтобы проводимое сравнение было справедливым. Рандомизация делает группы лечения взаимозаменяемыми в ожидании, устраняя смешивающие факторы как измеренные, так и неизмеренные; сопоставление и стратификация устраняют или контролируют смешивающие факторы по заданным параметрам; а блокировка поддерживает сбалансированный размер групп с течением времени. Планирование размера выборки затем количественно связывает дизайн с вопросом, преобразуя целевой размер эффекта, принятый уровень значимости и желаемую мощность в необходимое количество субъектов, с учетом ожидаемого выбывания. Заблаговременное планирование на случай отсутствующих данных сохраняет валидность, которую призваны обеспечить эти методы.
Clinical relevance
Качество доказательств, на которые опираются клиницисты и политики, в значительной степени определяется на этапе дизайна, поэтому понимание этих методов имеет центральное значение для оценки того, заслуживают ли выводы исследования доверия. Эта область описывает, как планируются и генерируются надежные доказательства; она является справочником по критической оценке и методологии исследований и не является источником диагностических или лечебных рекомендаций.
Evidence & guidelines
Руководства по отчетности кодифицируют передовую практику дизайна: заявление CONSORT 2010 и его пояснительный документ устанавливают ожидания относительно того, как рандомизация, размер выборки и поток участников (включая потери) сообщаются в исследованиях. Методологические обзоры в общей медицинской литературе, такие как серия Lancet по эпидемиологии, дают доступные объяснения того, как выбор дизайна защищает валидность, а стандартные тексты, такие как «Современная эпидемиология» (Modern Epidemiology), предоставляют базовую основу.
History
Современный дизайн исследований вырос из сельскохозяйственных экспериментов Р. А. Фишера начала XX века, который ввел рандомизацию, репликацию и блокировку, а также из клинической и эпидемиологической практики середины века, где были формализованы рандомизированные исследования и обсервационные дизайны. Расчет мощности и размера выборки вошел в рутинную практику по мере принятия концепции проверки гипотез Неймана-Пирсона, а стандарты отчетности, такие как CONSORT, позже закрепили ожидания относительно того, как эти элементы дизайна планируются и раскрываются.
Key figures
- Kenneth Schulz
- David Grimes
- Douglas Altman
- Kenneth Rothman
- Sander Greenland
Related topics
Seminal works
- moher-2010-consort
- schulz-grimes-2002-sampsize
- rothman-2008-me
Frequently asked questions
- Почему дизайн исследования считается более важным, чем статистический анализ?
- Анализ может только описывать данные, полученные в результате дизайна; ошибочный дизайн (несправедливое сравнение, слишком мало субъектов или незапланированные потери) вносит систематическую ошибку или неточность, которые никакой последующий анализ не может полностью исправить, поэтому решения, принятые до сбора данных, в значительной степени определяют, что может быть заключено.
- Что отличает темы, сгруппированные в этой области?
- Все они касаются решений, принимаемых до сбора данных: насколько большим должно быть исследование (размер выборки), как сформировать сопоставимые группы (сопоставление, стратификация, рандомизация, блокировка) и как планировать на случай неполных данных (отсутствующие данные и выбывание участников).