Estruturação Populacional e Admixture
A estruturação populacional é a presença de diferenças sistemáticas na ancestralidade genética entre os grupos comparados de um estudo genético, e a admixture é a mistura de ancestralidades dentro de indivíduos de populações previamente separadas. Ambos criam uma estrutura populacional que pode confundir estudos de associação genética, gerando ligações espúrias entre uma variante e uma doença simplesmente porque a frequência alélica e o risco de doença diferem por ancestralidade.
Definition
A estruturação populacional é um fator de confusão em um estudo de associação genética causado por diferenças de ancestralidade entre grupos, no qual as frequências alélicas e o risco de doença variam entre subpopulações; a admixture é a presença, dentro de indivíduos, de ancestralidade genética de duas ou mais populações historicamente distintas, uma fonte relacionada de estrutura.
Scope
O tópico aborda como a estrutura populacional surge, por que ela confunde estudos de associação genética caso-controle e os principais métodos usados para detectá-la e ajustá-la. É apresentado como um assunto metodológico em epidemiologia genética — preocupado com a validade do estudo — e não como uma declaração sobre a biologia ou classificação de grupos populacionais humanos.
Core questions
- Os grupos comparados em um estudo genético são provenientes da mesma população subjacente?
- Uma aparente associação variante-doença poderia ser explicada pela ancestralidade em vez de causalidade?
- Como a estrutura populacional pode ser detectada a partir de dados genéticos?
- Como os testes de associação podem ser ajustados para que a estrutura não infle os falsos positivos?
Key concepts
- Confundimento por ancestralidade
- Estrutura e subestrutura populacional
- Admixture
- Diferenças de frequência alélica
- Controle genômico
- Análise de componentes principais da ancestralidade
- Modelos mistos para parentesco
Mechanisms
Se os casos e controles em um estudo de associação diferem em ancestralidade, qualquer variante cuja frequência difere entre esses grupos ancestrais parecerá associada à doença sempre que o risco de doença também diferir entre os grupos, mesmo quando a variante não tiver um papel causal. Este é o confundimento clássico, com a ancestralidade genética como fator de confusão. Os métodos abordam isso medindo e ajustando a ancestralidade: o controle genômico reescala as estatísticas de teste usando um fator de inflação estimado a partir de muitos marcadores; a análise de componentes principais resume a ancestralidade a partir de genótipos de todo o genoma e inclui esses componentes como covariáveis; e os modelos mistos consideram tanto a estrutura ampla quanto o parentesco críptico. A admixture, onde os indivíduos carregam ancestralidade mista, pode ser tratada com abordagens relacionadas que estimam a ancestralidade local ou global.
Clinical relevance
O controle da estrutura populacional é essencial para a validade da evidência de associação genética que informa a compreensão do risco de doenças crônicas, uma vez que a estratificação descontrolada pode produzir associações falsas que desorientam pesquisas posteriores. Como tópico de referência, esta entrada explica uma ameaça à validade do estudo e como ela é abordada; não fornece orientação para testes ou interpretação genética individual.
Epidemiology
A preocupação com a estratificação cresceu à medida que os estudos de associação genética aumentaram em escala, porque mesmo diferenças modestas de ancestralidade entre casos e controles podem inflar as taxas de falsos positivos entre as muitas variantes testadas em um estudo de genoma completo. O desenvolvimento do controle genômico e, subsequentemente, do ajuste por componentes principais e modelos mistos tornou viáveis grandes estudos de associação multi-ancestralidade, mantendo as taxas de falsos positivos controladas.
History
A consciência de que a ancestralidade poderia confundir estudos de associação precede a era genômica, mas soluções práticas surgiram no final dos anos 1990 e 2000. Pritchard e Rosenberg propuseram o uso de marcadores não ligados para detectar a estratificação, Devlin e Roeder introduziram o controle genômico para corrigir estatísticas de teste inflacionadas, e Price e colegas mostraram em 2006 que a análise de componentes principais poderia corrigir eficientemente a estratificação em estudos de associação de genoma completo, uma abordagem que se tornou prática padrão.
Debates
- Quão completamente o ajuste estatístico pode remover o confundimento por ancestralidade?
- O controle genômico, os componentes principais e os modelos mistos reduzem a inflação da estrutura populacional, mas o debate continua sobre o confundimento residual de estruturas de pequena escala ou recentes e sobre quão bem essas correções se transferem entre populações diversas e com admixture.
Key figures
- Jonathan Pritchard
- Noah Rosenberg
- Bernie Devlin
- Kathryn Roeder
- Alkes Price
- David Reich
Related topics
Seminal works
- pritchard-rosenberg-1999
- devlin-roeder-1999
- price-2006
Frequently asked questions
- Por que a estratificação populacional causa associações falsas?
- Quando casos e controles diferem em ancestralidade, variantes que simplesmente diferem em frequência entre grupos ancestrais podem parecer associadas à doença sempre que o risco de doença também diferir por ancestralidade, de modo que a associação reflete o confundimento por ancestralidade em vez de um efeito causal da variante.
- Como os estudos modernos corrigem a estrutura populacional?
- Abordagens comuns estimam a ancestralidade a partir de dados de genoma completo e a ajustam, por exemplo, incluindo componentes principais de ancestralidade como covariáveis, aplicando controle genômico para reescalar estatísticas de teste ou usando modelos mistos que consideram o parentesco e a estrutura.