Anotação Funcional de Variantes Genômicas
O sequenciamento de um genoma produz milhões de variantes, mas a maioria tem consequências desconhecidas. A anotação funcional é o processo de atribuir significado biológico a cada variante — onde ela se localiza, qual gene ou elemento regulatório afeta e qual a probabilidade de alterar a função — para que as poucas variantes importantes possam ser distinguidas das muitas que não o são.
Definition
A anotação funcional de variantes genômicas é a atribuição de contexto biológico e de consequências funcionais preditas a variantes de sequência, incluindo sua localização genômica, genes ou elementos regulatórios afetados, efeito molecular (como missense, nonsense, alteração de splicing ou regulatório) e um impacto predito na função.
Scope
Este tópico abrange a anotação de variantes de nucleotídeo único, inserções, deleções e alterações estruturais: localizando variantes em relação a genes e regiões regulatórias, classificando suas consequências moleculares e prevendo a deletariedade para sítios codificadores e não codificadores. Ele trata a anotação como um assunto metodológico e de referência e não fornece interpretação de variantes para casos clínicos individuais.
Core questions
- Onde uma variante se localiza em relação a genes, éxons, sítios de splicing e elementos regulatórios?
- Qual é sua consequência molecular — ela altera uma proteína, interrompe o splicing ou afeta a regulação?
- Qual a probabilidade de a variante ser deletéria para a função?
- Como as variantes não codificadoras, que não possuem uma leitura simples de alteração de proteína, podem ser interpretadas?
Key concepts
- Localização da variante e classificação da consequência
- Variantes missense, nonsense, frameshift e de splicing
- Predição de deletariedade para variantes codificadoras
- Anotação de variantes não codificadoras e regulatórias
- Fontes de anotação de referência (modelos de genes, conservação, mapas de elementos funcionais)
- Loci de características quantitativas de expressão (eQTLs)
Mechanisms
Os pipelines de anotação primeiro mapeiam cada variante em um genoma de referência e um conjunto de modelos de genes para determinar sua posição e consequência básica — se ela se encontra em um éxon codificador, um sítio de splicing, uma região não traduzida ou uma região intergênica — usando ferramentas como ANNOVAR e SnpEff. Para variantes codificadoras que alteram um aminoácido, algoritmos de predição como o SIFT estimam se a substituição é tolerada ou prejudicial, baseando-se na conservação da sequência entre espécies. Variantes não codificadoras são mais difíceis de interpretar porque não alteram uma proteína; aqui a anotação depende de mapas de elementos funcionais, como os do ENCODE, e de ligações entre variantes genéticas e expressão gênica (eQTLs) catalogadas por projetos como o GTEx. O resultado é uma descrição em camadas de cada variante que apoia a priorização a jusante.
Clinical relevance
A anotação de variantes é uma etapa fundamental na pesquisa genômica e nos pipelines analíticos usados para interpretar dados de sequenciamento. Ela descreve como as variantes candidatas são caracterizadas e priorizadas; as previsões que produz são hipóteses computacionais e não são, por si só, uma determinação de patogenicidade ou uma base para decisões diagnósticas ou de tratamento individuais.
History
À medida que o sequenciamento de alto rendimento tornou os dados de exoma completo e genoma completo rotineiros no final dos anos 2000, o gargalo mudou da geração de variantes para a sua interpretação. Preditoras baseadas em conservação, como o SIFT (2009), abordaram variantes codificadoras, enquanto motores de anotação gerais, como ANNOVAR (2010) e SnpEff (2012), sistematizaram a atribuição de consequências entre os tipos de variantes. Grandes catálogos de elementos funcionais, como o ENCODE (2012), e recursos de expressão, como o GTEx (2015), estenderam então a interpretação para o genoma não codificador, que constitui a grande maioria da variação.
Debates
- Como as variantes não codificadoras devem ser interpretadas?
- Variantes codificadoras têm uma leitura molecular relativamente interpretável, mas a maior parte da variação é não codificadora e carece de uma consequência proteica direta; sua interpretação depende de mapas de elementos funcionais e evidências de eQTLs, cuja completude e especificidade tecidual ainda são limitantes.
Key figures
- Kai Wang
- Pauline Ng
- Steven Henikoff
- Pablo Cingolani
Related topics
Seminal works
- kumar-2009
- wang-2010
- cingolani-2012
- encode-2012
Frequently asked questions
- O que significa anotar uma variante?
- Significa atribuir contexto biológico à variante: onde ela se localiza em relação a genes e elementos regulatórios, qual consequência molecular ela tem e qual a probabilidade de afetar a função — para que variantes importantes possam ser diferenciadas das neutras.
- Por que as variantes não codificadoras são mais difíceis de anotar do que as codificadoras?
- Variantes codificadoras podem ser lidas contra o código genético para prever uma alteração proteica, mas as variantes não codificadoras não têm essa leitura direta; sua interpretação depende de mapas de elementos regulatórios e de ligações entre variantes e expressão gênica, que ainda estão incompletos.