Sequenciamento e Montagem de Genomas
Ler um genoma significa determinar a ordem de seus bilhões de bases, o que as máquinas de sequenciamento fazem apenas em pequenos pedaços, deixando para o software a tarefa de reconstruir a sequência completa, encontrando onde esses pedaços se sobrepõem.
Definition
O sequenciamento de genomas é a determinação experimental da ordem de nucleotídeos do DNA de um organismo, e a montagem é a reconstrução computacional da sequência completa a partir das muitas leituras curtas que um sequenciador produz.
Scope
Este tópico abrange o sequenciamento dideoxi de Sanger, os princípios do sequenciamento de próxima geração e de leitura longa, as estratégias de "whole-genome shotgun" e baseadas em clones, a montagem computacional de leituras em contigs e scaffolds, medidas de qualidade de montagem como cobertura e contiguidade, e os genomas de referência resultantes. Ele trata de como a sequência de um genoma é determinada; a interpretação dessa sequência é abordada nos tópicos adjacentes.
Core questions
- Como o sequenciamento de Sanger determina a ordem das bases usando terminadores de cadeia?
- O que torna o sequenciamento de próxima geração e de leitura longa mais rápidos e baratos, e quais são suas vantagens e desvantagens?
- Como milhões de leituras sobrepostas são montadas em cromossomos?
- O que as medidas de cobertura e contiguidade nos dizem sobre a qualidade de uma montagem?
Key concepts
- Sequenciamento dideoxi de Sanger
- Sequenciamento de próxima geração e de leitura longa
- Estratégia "whole-genome shotgun"
- Montagem de leituras: contigs e scaffolds
- Cobertura, contiguidade e genomas de referência
Mechanisms
O sequenciamento de Sanger utiliza dideoxinucleotídeos terminadores de cadeia para gerar uma escada de fragmentos cujos comprimentos revelam a sequência; plataformas massivamente paralelas leem milhões de fragmentos de uma vez, e o software de montagem detecta sobreposições entre as leituras para fundi-las em contigs, ordenando e orientando-as em scaffolds ao longo de cada cromossomo.
Clinical relevance
O sequenciamento acessível tornou o sequenciamento de genoma completo e de exoma rotineiro para diagnosticar doenças hereditárias raras, perfilar tumores, identificar patógenos e rastrear recém-nascidos, transformando a determinação de sequência de um projeto marcante em um teste laboratorial padrão.
History
Sanger introduziu o sequenciamento de terminação de cadeia em 1977, o Projeto Genoma Humano aplicou estratégias clone-a-clone e "shotgun" para produzir um rascunho da sequência humana em 2001, e a chegada do sequenciamento de próxima geração em meados dos anos 2000, seguido por plataformas de leitura longa, impulsionou o custo de um genoma humano de bilhões de dólares para algumas centenas.
Key figures
- Frederick Sanger
- Eric Lander
- Craig Venter
Related topics
Seminal works
- sanger1977
- lander2001
Frequently asked questions
- Por que um genoma deve ser montado em vez de apenas lido diretamente?
- Os instrumentos de sequenciamento só conseguem ler pequenos trechos de DNA por vez, então um genoma é quebrado em inúmeros fragmentos; o software de montagem então reconstrói a ordem original detectando onde os fragmentos se sobrepõem.
- O que significa cobertura de sequenciamento?
- Cobertura é o número médio de vezes que cada base no genoma é lida; uma cobertura mais alta confere maior confiança em cada chamada e ajuda a distinguir variantes verdadeiras de erros de sequenciamento.