Предвзятость репрезентации в фармакогеномных исследованиях
Предвзятость репрезентации — это систематическая чрезмерная представленность одних популяций (в подавляющем большинстве случаев — людей европейского происхождения) и недостаточная представленность других в когортах, референсных базах данных и валидационных исследованиях, лежащих в основе фармакогеномики. Поскольку фармакогенетические открытия и аннотации калибруются по изучаемым популяциям, этот дисбаланс делает доказательную базу менее полной и менее надежной для недостаточно представленных групп.
Definition
Систематическое искажение фармакогеномных данных, при котором когорты для открытий, референсные панели и валидационные исследования непропорционально охватывают определенные популяции — главным образом европейского происхождения, — что приводит к получению результатов и инструментов, которые неравномерно применимы ко всему человечеству.
Scope
Эта тема документирует масштабы пробела в разнообразии в геномных и фармакогеномных исследованиях, механизмы, посредством которых он искажает результаты, и его последующие последствия для равенства. Это методологический и справочный обзор; он не содержит клинических рекомендаций.
Core questions
- Насколько неравномерно представлены популяции в геномных и фармакогеномных исследованиях?
- Посредством каких механизмов недостаточная представленность искажает открытия, аннотации и валидацию?
- Каковы последствия пробела в разнообразии для равенства?
- Какие инициативы расширяют разнообразие геномных данных?
- Как предвзятость репрезентации взаимодействует с переносимостью генетических предикторов?
Key concepts
- Чрезмерная и недостаточная представленность
- Предвзятость отбора
- Состав референсной панели
- Переносимость (портативность) предикторов
- Интерпретация и реклассификация вариантов
- Разнообразные биобанки и консорциумы (например, TOPMed, H3Africa, All of Us)
- Неравенство в отношении здоровья
Mechanisms
Предвзятость возникает на нескольких этапах. Когорты для открытий, состоящие в основном из участников европейского происхождения, выявляют варианты, распространенные в этой группе, поэтому варианты, преобладающие в других местах, с меньшей вероятностью будут обнаружены или функционально аннотированы. Референсные панели, собранные из искаженных данных, лучше импутируют и интерпретируют вариации для хорошо представленных популяций. Валидационные исследования, проведенные в тех же группах, подтверждают эффективность там, но оставляют общую применимость непроверенной в других местах. Как следствие, генетические предикторы, включая полигенные оценки, как правило, плохо переносятся на недостаточно представленные популяции, а варианты в этих популяциях чаще классифицируются как имеющие неопределенное значение. Африканские популяции, обладающие наибольшим генетическим разнообразием, особенно затронуты, потому что большая часть их вариаций просто отсутствует в евроцентричных ресурсах.
Clinical relevance
Предвзятость репрезентации имеет центральное значение для оценки того, является ли фармакогеномное открытие или инструмент надежным для данной популяции. Эта статья описывает, как возникает предвзятость и что она означает для полноты доказательств; она не является клиническим руководством и не затрагивает тестирование или лечение отдельных лиц.
Epidemiology
Аудиты полногеномных ассоциативных и геномных исследований неоднократно показывали, что участники европейского происхождения составляют подавляющее большинство среди исследуемых — значительно выше их доли в мировом населении, — в то время как африканские, латиноамериканские и многие азиатские и коренные популяции остаются заметно недопредставленными, и этот разрыв сокращается лишь медленно, несмотря на постоянное внимание.
History
Обеспокоенность по поводу отсутствия разнообразия в геномике была кристаллизована анализом Поупджоя и Фуллертона 2016 года, показавшим доминирование участников европейского происхождения, и усилена обзором Сируго и коллег 2019 года, документирующим сохранение этого разрыва. Мартин и коллеги (2019) продемонстрировали конкретный вред — худшую и потенциально увеличивающую неравенство производительность полигенных оценок в неевропейских популяциях. Инициативы, такие как программа NHLBI TOPMed, H3Africa и крупные разнообразные биобанки, возникли отчасти для устранения этого дисбаланса.
Debates
- Почему пробел в разнообразии сохраняется, несмотря на внимание?
- Объяснения включают укоренившуюся инфраструктуру набора, модели финансирования, историческое недоверие среди маргинализированных сообществ и методологическое удобство; комментаторы расходятся во мнениях относительно того, какие рычаги наиболее эффективно сокращают этот разрыв.
Key figures
- Alice B. Popejoy
- Stephanie M. Fullerton
- Sarah Tishkoff
- Alicia R. Martin
- Charles Rotimi
Related topics
Seminal works
- popejoy-2016
- sirugo-2019
- martin-2019
Frequently asked questions
- Почему важно, что большинство геномных исследований проводится в популяциях европейского происхождения?
- Фармакогеномные открытия, интерпретация вариантов и прогностические инструменты калибруются по изучаемым популяциям. Когда эти популяции в основном европейского происхождения, полученные знания менее полны и менее надежны для других популяций, что способствует неравенству в отношении здоровья.
- Решает ли добавление разнообразных данных проблему?
- Расширение разнообразия когорт и референсных панелей необходимо и помогает, но оно должно сочетаться с аналитическими методами, которые переносятся между популяциями, и с вниманием к доверию сообщества и справедливому распределению выгод.