ScholarGate
Assistente

Estruturação Populacional e Ancestralidade em GWAS

A estruturação populacional é a diferença sistemática na ancestralidade entre as pessoas comparadas em um estudo genético. Quando casos e controles diferem em sua origem ancestral, qualquer variante cuja frequência difira entre essas ancestralidades parecerá associada à característica, mesmo que não tenha um papel causal - um fator de confusão que pode gerar falsos positivos em todo o genoma. Detectar e ajustar a ancestralidade é, portanto, uma salvaguarda essencial para a validação de testes de associação.

Encontrar tema com PaperMindEm breveFind papers & topics
Tools & resources
Baixar slides
Learn & explore
VídeoEm breve

Definition

A estruturação populacional é a confusão da associação genótipo-fenótipo por diferenças sistemáticas de ancestralidade entre grupos comparados, e seu controle é o conjunto de métodos - principalmente componentes principais de ancestralidade e modelos mistos - que ajustam os testes de associação para que os sinais reflitam efeitos dentro da ancestralidade, em vez da própria ancestralidade.

Scope

Este tópico aborda por que as diferenças de ancestralidade confundem os testes de associação, como a estratificação é detectada (inflação genômica, análise de componentes principais), como é corrigida (covariáveis de componentes principais, modelos mistos, controle genômico) e a preocupação mais ampla de equidade de que o viés de ancestralidade europeia dos GWAS limita a transferibilidade dos achados e dos escores poligênicos. É uma referência de métodos, não uma orientação clínica.

Core questions

  • Como as diferenças de ancestralidade entre casos e controles criam associações espúrias?
  • Como a estratificação é detectada e o que indica um fator de controle genômico inflacionado?
  • Como a análise de componentes principais corrige a ancestralidade?
  • Quando os modelos mistos são preferidos para lidar com estrutura e parentesco?
  • Por que o viés de ancestralidade europeia dos GWAS limita a generalização?

Key concepts

  • Confusão por ancestralidade
  • Controle genômico e o fator de inflação (lambda)
  • Análise de componentes principais de genótipos
  • Marcadores informativos de ancestralidade
  • Modelos lineares mistos para estrutura e parentesco
  • Admistura e ancestralidade contínua
  • Transferibilidade de achados e escores poligênicos entre ancestralidades

Mechanisms

Se subgrupos de ancestralidade diferente forem representados de forma desigual entre casos e controles, e se tanto o risco de doença quanto as frequências alélicas diferirem entre esses subgrupos, a frequência alélica acompanhará a característica através da ancestralidade, e não da causalidade, inflando as estatísticas de teste em todo o genoma. A detecção baseia-se nesta assinatura genômica: o fator de inflação do controle genômico resume o quanto a estatística de teste mediana excede sua expectativa nula, e a análise de componentes principais de genótipos de todo o genoma revela eixos de variação de ancestralidade entre as amostras. A correção tipicamente inclui os principais componentes principais como covariáveis na regressão, o que absorve o sinal de ancestralidade, ou usa modelos lineares mistos que contabilizam conjuntamente a estrutura e o parentesco críptico através de uma matriz de relacionamento genético. Painéis de referência, como o Projeto 1000 Genomas, ajudam a posicionar as amostras em um mapa de ancestralidade global e a informar a imputação. Como a maioria das amostras de GWAS são de ancestralidade europeia, mesmo análises bem corrigidas produzem estimativas de efeito e escores poligênicos que se transferem imperfeitamente para outras populações.

Clinical relevance

O ajuste para a ancestralidade é essencial para a validade da evidência genética utilizada na pesquisa de doenças, e a composição ancestral dos estudos afeta diretamente a biologia de quem é representada nos achados e escores genômicos. Este tópico é descritivo de métodos e considerações de equidade; não é uma base para testes genéticos individuais ou interpretação clínica.

Evidence & guidelines

Os padrões aqui provêm da literatura metodológica, e não de diretrizes clínicas. Price et al. (2006) introduziram a correção por componentes principais (a abordagem EIGENSTRAT) como uma solução escalável; Price et al. (2010) revisaram e estenderam estratégias, incluindo modelos mistos; o Projeto 1000 Genomas (2015) forneceu a referência diversa necessária para caracterizar a ancestralidade; e Visscher et al. (2017) destacam as consequências de generalização e equidade do desequilíbrio de ancestralidade.

History

A preocupação de que a ancestralidade pudesse confundir a associação genética precede os GWAS, e abordagens iniciais, como o controle genômico e a associação estruturada, foram desenvolvidas para abordá-la. A introdução da análise de componentes principais em 2006 forneceu uma maneira rápida e genômica de modelar a ancestralidade contínua e se tornou prática padrão, posteriormente complementada por métodos de modelo misto que também lidam com o parentesco. À medida que os GWAS foram escalados para biobancos, o campo reconheceu cada vez mais que controlar a estratificação dentro de amostras predominantemente europeias não resolve o problema maior da sub-representação de outras ancestralidades.

Debates

As correções de ancestralidade removem completamente a confusão, ou podem também remover o sinal real?
Componentes principais e modelos mistos controlam a estratificação de forma eficaz na maioria dos contextos, mas distinguir a confusão da biologia genuinamente correlacionada à ancestralidade - e evitar a supercorreção que apaga efeitos reais - continua sendo um julgamento metodológico, especialmente para características com estrutura geográfica sutil.
O viés de ancestralidade europeia dos GWAS compromete a equidade e a validade?
Achados e escores poligênicos derivados principalmente de amostras de ancestralidade europeia transferem-se imperfeitamente para outras populações, levantando preocupações científicas sobre a generalização e preocupações de equidade sobre a distribuição dos benefícios da medicina genômica.

Key figures

  • Alkes Price
  • David Reich
  • Nick Patterson
  • Noah Zaitlen
  • Peter Visscher

Related topics

Seminal works

  • price-2006
  • price-2010

Frequently asked questions

Como a estratificação populacional cria resultados falsos em GWAS?
Se casos e controles diferem em ancestralidade, variantes cuja frequência difere entre essas ancestralidades parecem associadas à característica através da ancestralidade, e não da causalidade, produzindo associações espúrias em todo o genoma.
Como a estratificação é geralmente corrigida?
A abordagem padrão inclui os principais componentes principais de genótipos de todo o genoma como covariáveis, ou usa um modelo linear misto, para que os testes de associação reflitam efeitos dentro da ancestralidade, e não as próprias diferenças de ancestralidade.

Methods for this concept

Related concepts