Por que a estratificação populacional causa associações falsas?

Quando casos e controles diferem em ancestralidade, variantes que simplesmente diferem em frequência entre grupos ancestrais podem parecer associadas à doença sempre que o risco de doença também diferir por ancestralidade, de modo que a associação reflete o confundimento por ancestralidade em vez de um efeito causal da variante.

Como os estudos modernos corrigem a estrutura populacional?

Abordagens comuns estimam a ancestralidade a partir de dados de genoma completo e a ajustam, por exemplo, incluindo componentes principais de ancestralidade como covariáveis, aplicando controle genômico para reescalar estatísticas de teste ou usando modelos mistos que consideram o parentesco e a estrutura.

Estruturação Populacional e Admixture

A estruturação populacional é a presença de diferenças sistemáticas na ancestralidade genética entre os grupos comparados de um estudo genético, e a admixture é a mistura de ancestralidades dentro de indivíduos de populações previamente separadas. Ambos criam uma estrutura populacional que pode confundir estudos de associação genética, gerando ligações espúrias entre uma variante e uma doença simplesmente porque a frequência alélica e o risco de doença diferem por ancestralidade.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

A estruturação populacional é um fator de confusão em um estudo de associação genética causado por diferenças de ancestralidade entre grupos, no qual as frequências alélicas e o risco de doença variam entre subpopulações; a admixture é a presença, dentro de indivíduos, de ancestralidade genética de duas ou mais populações historicamente distintas, uma fonte relacionada de estrutura.

Scope

O tópico aborda como a estrutura populacional surge, por que ela confunde estudos de associação genética caso-controle e os principais métodos usados para detectá-la e ajustá-la. É apresentado como um assunto metodológico em epidemiologia genética — preocupado com a validade do estudo — e não como uma declaração sobre a biologia ou classificação de grupos populacionais humanos.

Core questions

Os grupos comparados em um estudo genético são provenientes da mesma população subjacente?
Uma aparente associação variante-doença poderia ser explicada pela ancestralidade em vez de causalidade?
Como a estrutura populacional pode ser detectada a partir de dados genéticos?
Como os testes de associação podem ser ajustados para que a estrutura não infle os falsos positivos?

Key concepts

Confundimento por ancestralidade
Estrutura e subestrutura populacional
Admixture
Diferenças de frequência alélica
Controle genômico
Análise de componentes principais da ancestralidade
Modelos mistos para parentesco

Mechanisms

Se os casos e controles em um estudo de associação diferem em ancestralidade, qualquer variante cuja frequência difere entre esses grupos ancestrais parecerá associada à doença sempre que o risco de doença também diferir entre os grupos, mesmo quando a variante não tiver um papel causal. Este é o confundimento clássico, com a ancestralidade genética como fator de confusão. Os métodos abordam isso medindo e ajustando a ancestralidade: o controle genômico reescala as estatísticas de teste usando um fator de inflação estimado a partir de muitos marcadores; a análise de componentes principais resume a ancestralidade a partir de genótipos de todo o genoma e inclui esses componentes como covariáveis; e os modelos mistos consideram tanto a estrutura ampla quanto o parentesco críptico. A admixture, onde os indivíduos carregam ancestralidade mista, pode ser tratada com abordagens relacionadas que estimam a ancestralidade local ou global.

Clinical relevance

O controle da estrutura populacional é essencial para a validade da evidência de associação genética que informa a compreensão do risco de doenças crônicas, uma vez que a estratificação descontrolada pode produzir associações falsas que desorientam pesquisas posteriores. Como tópico de referência, esta entrada explica uma ameaça à validade do estudo e como ela é abordada; não fornece orientação para testes ou interpretação genética individual.

Epidemiology

A preocupação com a estratificação cresceu à medida que os estudos de associação genética aumentaram em escala, porque mesmo diferenças modestas de ancestralidade entre casos e controles podem inflar as taxas de falsos positivos entre as muitas variantes testadas em um estudo de genoma completo. O desenvolvimento do controle genômico e, subsequentemente, do ajuste por componentes principais e modelos mistos tornou viáveis grandes estudos de associação multi-ancestralidade, mantendo as taxas de falsos positivos controladas.

History

A consciência de que a ancestralidade poderia confundir estudos de associação precede a era genômica, mas soluções práticas surgiram no final dos anos 1990 e 2000. Pritchard e Rosenberg propuseram o uso de marcadores não ligados para detectar a estratificação, Devlin e Roeder introduziram o controle genômico para corrigir estatísticas de teste inflacionadas, e Price e colegas mostraram em 2006 que a análise de componentes principais poderia corrigir eficientemente a estratificação em estudos de associação de genoma completo, uma abordagem que se tornou prática padrão.

Debates

Quão completamente o ajuste estatístico pode remover o confundimento por ancestralidade?: O controle genômico, os componentes principais e os modelos mistos reduzem a inflação da estrutura populacional, mas o debate continua sobre o confundimento residual de estruturas de pequena escala ou recentes e sobre quão bem essas correções se transferem entre populações diversas e com admixture.

Key figures

Jonathan Pritchard
Noah Rosenberg
Bernie Devlin
Kathryn Roeder
Alkes Price
David Reich

Seminal works

pritchard-rosenberg-1999
devlin-roeder-1999
price-2006

Frequently asked questions

Por que a estratificação populacional causa associações falsas?: Quando casos e controles diferem em ancestralidade, variantes que simplesmente diferem em frequência entre grupos ancestrais podem parecer associadas à doença sempre que o risco de doença também diferir por ancestralidade, de modo que a associação reflete o confundimento por ancestralidade em vez de um efeito causal da variante.
Como os estudos modernos corrigem a estrutura populacional?: Abordagens comuns estimam a ancestralidade a partir de dados de genoma completo e a ajustam, por exemplo, incluindo componentes principais de ancestralidade como covariáveis, aplicando controle genômico para reescalar estatísticas de teste ou usando modelos mistos que consideram o parentesco e a estrutura.