ScholarGate
Asistente

Diversidad de nucleótidos y clasificación de variantes

La diversidad de nucleótidos mide la diferencia promedio entre dos secuencias elegidas al azar de una población, mientras que la clasificación de variantes organiza los diversos tipos de diferencias en el ADN —sustituciones de un solo nucleótido, pequeñas inserciones y deleciones, y cambios estructurales más grandes— en un vocabulario coherente. Juntas, describen tanto la cantidad de variación que posee un genoma como la naturaleza de dicha variación.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

La diversidad de nucleótidos (comúnmente denotada como pi) es el número promedio de diferencias de nucleótidos por sitio entre dos secuencias muestreadas de una población; la clasificación de variantes es la categorización sistemática de las diferencias de secuencia observadas (p. ej., variantes de un solo nucleótido, indels, variantes estructurales).

Scope

Esta entrada abarca las medidas resumen estándar de la variación de secuencia dentro de una población, especialmente la diversidad de nucleótidos y el número de sitios segregantes, así como la clasificación de los tipos de variantes por tamaño y por su efecto predicho en la secuencia. Se tratan estos como conceptos descriptivos y metodológicos; no se asigna significado clínico a variantes particulares.

Core questions

  • ¿Cómo se resume la cantidad de variación de secuencia en una muestra?
  • ¿En qué se diferencian la diversidad de nucleótidos y el número de sitios segregantes como estimadores?
  • ¿Cuáles son las principales clases de variantes genéticas por tamaño y tipo?
  • ¿Cómo se representan e intercambian las variantes en un formato de archivo estándar?

Key concepts

  • Diversidad de nucleótidos (pi)
  • Sitios segregantes y theta de Watterson
  • Variante de un solo nucleótido (SNV/SNP)
  • Inserción-deleción (indel)
  • Variante estructural
  • Alelos de referencia y alternativos
  • Variant Call Format (VCF)

Key theories

Modelo de sitios infinitos y theta
Bajo la suposición de sitios infinitos, cada nueva mutación ocurre en un sitio previamente no mutado, por lo que el parámetro de mutación poblacional theta puede estimarse a partir del número de sitios segregantes (estimador de Watterson) o de las diferencias promedio por pares (diversidad de nucleótidos); la discrepancia sistemática entre ambos es informativa sobre las desviaciones de la neutralidad.

Mechanisms

La variación se detecta primero alineando las lecturas secuenciadas con un genoma de referencia e identificando las posiciones que difieren; las diferencias se clasifican luego por tamaño y forma. Las estadísticas resumen condensan esto en medidas a nivel de población: el número de sitios segregantes subyace al estimador theta de Watterson, mientras que las diferencias promedio por pares definen la diversidad de nucleótidos. Dado que ambos estiman el mismo parámetro bajo un modelo neutral de tamaño constante, su diferencia (formalizada por Tajima) indica cambios demográficos o selección. La representación estandarizada en el formato Variant Call Format permite que las variantes se almacenen, compartan y comparen entre estudios.

Clinical relevance

Un vocabulario de variantes coherente y estimaciones fiables de la diversidad son requisitos previos para interpretar los datos genómicos en entornos de salud, ya que las mismas categorías descriptivas se utilizan cuando un genoma secuenciado se examina en busca de variantes clínicamente relevantes. Esta entrada explica cómo se describen y cuantifican las variantes y no constituye una base para decisiones diagnósticas o de tratamiento individuales.

Evidence & guidelines

Los estimadores fundamentales de la diversidad de secuencias fueron establecidos por Watterson y por Tajima, mientras que grandes estudios como el mapa temprano de SNP humanos y la referencia del Proyecto 1000 Genomas proporcionan la escala empírica de la variación humana. El Variant Call Format y sus herramientas son el estándar de facto de la comunidad para representar variantes clasificadas.

History

La genética de poblaciones molecular temprana cuantificó la variación mediante estudios de aloenzimas y sitios de restricción, y luego mediante la secuenciación de ADN. Los trabajos de Watterson de 1975 y de Tajima de 1989 proporcionaron los estimadores que aún se utilizan hoy en día, y el mapa de SNP humanos de 2001 y los consorcios de secuenciación posteriores convirtieron la catalogación de variantes en una empresa a escala genómica, acompañada de formatos estándar como VCF para representar las variantes resultantes.

Key figures

  • G. A. Watterson
  • Fumio Tajima
  • Richard Durbin
  • Gonçalo Abecasis

Related topics

Seminal works

  • watterson-1975
  • tajima-1989
  • snp-map-2001

Frequently asked questions

¿Cuál es la diferencia entre la diversidad de nucleótidos y el número de sitios segregantes?
El número de sitios segregantes cuenta cuántas posiciones varían en una muestra, mientras que la diversidad de nucleótidos promedia las diferencias entre pares de secuencias; ambos estiman el mismo parámetro subyacente bajo un modelo neutral simple, y su discrepancia es en sí misma informativa.
¿Es un SNP lo mismo que una mutación?
Un SNP es una variante de un solo nucleótido observada segregando en una población; se origina a partir de una mutación puntual, pero el término enfatiza que la variante está presente con una frecuencia apreciable en lugar de ser un cambio recién surgido en un solo individuo.

Methods for this concept

Related concepts