Estudos de Associação de Genoma Completo e Descoberta de Variantes
Um estudo de associação de genoma completo (GWAS) rastreia centenas de milhares a milhões de variantes genéticas nos genomas de muitos indivíduos para encontrar posições onde a frequência alélica difere sistematicamente entre pessoas com e sem uma característica ou doença. Ao testar o genoma inteiro sem uma hipótese prévia sobre qual gene está envolvido, o GWAS transformou a busca pela base genética de condições comuns e complexas de um jogo de adivinhação de genes candidatos em uma empreitada de descoberta sistemática e livre de hipóteses.
Definition
Um estudo de associação de genoma completo é um estudo genético observacional que testa a associação entre um fenótipo e variantes genéticas – tipicamente polimorfismos de nucleotídeo único – genotipadas ou imputadas em todo o genoma, declarando associação em variantes cuja evidência estatística sobrevive a um limiar de significância de genoma completo.
Scope
Esta área orienta o leitor para a família de métodos e conceitos que cercam a descoberta de variantes em populações não relacionadas: como um GWAS é projetado e analisado, por que o desequilíbrio de ligação permite que um arranjo esparso marque variantes não tipadas, por que grande parte da herdabilidade de características inicialmente parecia 'ausente', como as diferenças de ancestralidade podem criar associações espúrias e como as abordagens de variantes raras estendem a descoberta além dos SNPs comuns. Isso os enquadra como tópicos de referência metodológica em genômica, não como conteúdo clínico diagnóstico ou prescritivo.
Sub-topics
Core questions
- Como o genoma completo pode ser testado para associação com uma característica sem um gene candidato prévio?
- Por que a genotipagem de uma fração de variantes captura informações sobre o restante?
- Qual limiar de significância controla falsos positivos em milhões de testes?
- Por que os primeiros achados de GWAS explicavam apenas uma pequena parcela da herdabilidade estimada?
- Como as diferenças de ancestralidade entre casos e controles distorcem os sinais de associação?
Key concepts
- Hipótese da doença comum, variante comum
- Polimorfismo de nucleotídeo único (SNP)
- Desequilíbrio de ligação e SNPs de tag
- Limiar de significância de genoma completo (~5 x 10^-8)
- Imputação de genótipos a partir de painéis de referência
- Arquitetura poligênica e tamanhos de efeito
- Estratificação populacional
- Herdabilidade ausente
Mechanisms
Um GWAS genotipa um painel denso de variantes (ou as imputa contra um painel de referência sequenciado) e testa cada variante para associação estatística com o fenótipo, geralmente via regressão que ajusta para ancestralidade e outras covariáveis. Como variantes próximas são co-herdadas em blocos de desequilíbrio de ligação, um marcador tipado pode atuar como um proxy (tag) para variantes causais não tipadas, de modo que a associação em um marcador localiza um sinal em uma região, em vez de necessariamente na própria variante causal. O enorme número de testes requer um limiar de significância de genoma completo rigoroso para controlar falsos positivos, e os achados são confirmados por replicação em amostras independentes. A maioria das variantes descobertas são comuns, individualmente pequenas em efeito e frequentemente em regiões reguladoras não codificantes, consistente com uma arquitetura altamente poligênica para características comuns.
Clinical relevance
Os GWAS mapearam milhares de associações robustas variante-característica que informam a compreensão da biologia da doença, a priorização de alvos de medicamentos e a construção de escores poligênicos. Como área de referência, explica como a evidência genética em escala populacional é gerada e interpretada; descreve métodos e achados e não é uma base para diagnóstico individual, aconselhamento de risco ou decisões de tratamento.
Epidemiology
Desde a primeira onda de estudos por volta de 2005-2007, os GWAS foram aplicados a centenas de doenças e características quantitativas em coortes que variam de milhares a milhões de participantes, e repositórios curados como o NHGRI-EBI GWAS Catalog agora registram dezenas de milhares de associações. Uma limitação persistente é que a grande maioria dos participantes tem sido de ancestralidade europeia, o que restringe a transferibilidade dos achados e dos escores poligênicos para outras populações.
Evidence & guidelines
Os padrões metodológicos para GWAS foram consolidados por meio de grandes esforços de consórcio e sínteses de revisão, em vez de diretrizes de prática clínica. O estudo do Wellcome Trust Case Control Consortium (2007) é uma demonstração canônica do desenho de controle compartilhado e múltiplas doenças, e artigos de revisão de McCarthy et al. (2008) e Visscher et al. (2012, 2017) articulam expectativas de consenso sobre limiares de significância, controle de qualidade, replicação e interpretação.
History
A abordagem tornou-se viável assim que mapas densos de SNP e o projeto HapMap caracterizaram o desequilíbrio de ligação em todo o genoma, e uma vez que arrays de genotipagem acessíveis apareceram em meados dos anos 2000. O estudo do Wellcome Trust Case Control Consortium de 2007, testando sete doenças comuns contra controles compartilhados, demonstrou o desenho em escala e catalisou uma rápida expansão do mapeamento de associação. Revisões subsequentes acompanharam o amadurecimento do campo de um punhado de loci para catálogos de genoma completo, e sua consideração da herdabilidade ausente, diversidade populacional e a mudança para estudos de variantes raras e sequenciamento de genoma completo.
Debates
- Quanta da herdabilidade de características comuns os GWAS podem recuperar?
- Os primeiros loci de GWAS explicavam apenas uma pequena fração da herdabilidade estimada, o que gerou debate sobre se a lacuna reflete muitas variantes comuns de pequeno efeito não detectadas, variantes raras, variação estrutural ou herdabilidade superestimada; métodos posteriores de genoma completo estreitaram, mas não fecharam a lacuna.
- O viés de ancestralidade europeia dos GWAS limita a equidade e a validade?
- Como a maioria dos participantes tem sido de ancestralidade europeia, as associações descobertas e os escores poligênicos são transferidos imperfeitamente para outras populações, levantando preocupações científicas sobre a generalizabilidade e preocupações de equidade sobre quem se beneficia da medicina genômica.
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- Qual a diferença entre um GWAS e um estudo de ligação?
- Estudos de ligação acompanham a co-segregação de marcadores e doenças dentro de famílias e localizam amplas regiões cromossômicas, enquanto um GWAS testa a associação entre indivíduos não relacionados com alta resolução em todo o genoma, tornando-o mais adequado para variantes comuns de pequeno efeito.
- Por que os GWAS usam um limiar de significância tão rigoroso?
- Como milhões de variantes são testadas, um valor de p convencional de 0,05 produziria um número enorme de falsos positivos; um limiar de genoma completo próximo a 5 x 10^-8 considera os múltiplos testes implicados pela variação comum independente em todo o genoma.