ScholarGate
Asistente

RAID y fiabilidad del almacenamiento

RAID —matrices redundantes de discos económicos— combina múltiples dispositivos de almacenamiento utilizando seccionamiento (striping), duplicación (mirroring) y paridad para ofrecer mayor rendimiento, capacidad y tolerancia a fallos que cualquier dispositivo individual, y es la base del almacenamiento fiable en los centros de datos.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

RAID es una arquitectura de almacenamiento que combina múltiples unidades físicas en una única unidad lógica utilizando técnicas como el seccionamiento de datos, la duplicación y la paridad para mejorar el rendimiento y tolerar el fallo de una o más unidades sin pérdida de datos.

Scope

Este tema abarca la fiabilidad del almacenamiento mediante la redundancia: los niveles RAID estándar y sus compensaciones entre rendimiento, capacidad y tolerancia a fallos; el seccionamiento, la duplicación y la paridad; las métricas de fiabilidad como el tiempo medio entre fallos y los límites de la redundancia; y cómo RAID complementa, pero no reemplaza, las copias de seguridad. Excluye los propios dispositivos de almacenamiento (dispositivos de almacenamiento secundario) y la capa del sistema de archivos (sistemas de archivos).

Core questions

  • ¿Cómo el seccionamiento, la duplicación y la paridad proporcionan rendimiento y tolerancia a fallos?
  • ¿Cómo los niveles RAID comunes compensan la capacidad, el rendimiento y la fiabilidad?
  • ¿Cómo se cuantifica la fiabilidad de la matriz y cuáles son los límites de la redundancia?
  • ¿Por qué RAID no es un sustituto de las copias de seguridad?

Key concepts

  • seccionamiento de datos
  • duplicación (RAID 1)
  • paridad (RAID 5/6)
  • niveles RAID y compensaciones
  • tolerancia a fallos
  • tiempo medio entre fallos (MTTF)
  • reconstrucción y modo degradado
  • la redundancia no es una copia de seguridad

Key theories

Redundancia para un almacenamiento fiable
La combinación de muchos discos comerciales con información redundante (duplicación o paridad) produce una matriz que es más rápida y mucho más fiable que un solo disco; los niveles RAID formalizan cómo se organizan el seccionamiento y la redundancia para equilibrar el rendimiento, la capacidad utilizable y la tolerancia a los fallos.

Mechanisms

El seccionamiento distribuye los datos entre las unidades para paralelizar el acceso y aumentar el rendimiento. La duplicación mantiene copias completas en múltiples unidades para que la matriz sobreviva a la pérdida de una unidad. Los esquemas de paridad almacenan redundancia calculada que permite reconstruir los datos cuando falla una unidad, utilizando menos capacidad que la duplicación. Los niveles RAID estándar combinan estas técnicas de forma diferente; cuando falla una unidad, la matriz funciona en modo degradado y se reconstruye en un reemplazo utilizando los datos y la redundancia supervivientes.

Clinical relevance

RAID es omnipresente en servidores, sistemas de almacenamiento y centros de datos, donde los fallos de las unidades son rutinarios a gran escala y se requiere disponibilidad continua. Elegir el nivel RAID adecuado equilibra el costo, la velocidad y la resiliencia, pero RAID solo protege contra fallos de dispositivos, por lo que complementa, en lugar de reemplazar, las copias de seguridad contra la eliminación, la corrupción y los desastres.

History

El concepto RAID fue introducido en un artículo de 1988 por Patterson, Gibson y Katz en Berkeley, que proponía el uso de matrices de discos económicos con redundancia para igualar la fiabilidad y el rendimiento de las costosas unidades grandes. La taxonomía de los niveles RAID fue ampliamente adoptada, convirtiéndose en una práctica estándar en el almacenamiento empresarial y de centros de datos.

Debates

RAID de paridad versus duplicación a escala
A medida que crecía la capacidad de las unidades, los largos tiempos de reconstrucción del RAID de paridad aumentaron el riesgo de un segundo fallo durante la reconstrucción, lo que provocó un debate sobre una mayor redundancia (como la doble paridad) frente a la duplicación o esquemas alternativos de codificación de borrado para grandes matrices.

Key figures

  • David A. Patterson
  • Garth Gibson
  • Randy H. Katz
  • John L. Hennessy

Related topics

Seminal works

  • patterson1988raid
  • hennessy2019

Frequently asked questions

¿RAID reemplaza la necesidad de copias de seguridad?
No. RAID protege contra fallos de unidades almacenando datos redundantes, pero no protege contra la eliminación accidental, la corrupción de archivos, el malware, los fallos simultáneos de múltiples unidades o los desastres del sitio. Las copias de seguridad independientes siguen siendo esenciales; RAID mejora la disponibilidad, no la protección contra la pérdida de datos en general.
¿Cuál es la diferencia entre duplicación y paridad?
La duplicación mantiene copias duplicadas completas de los datos en unidades separadas, lo que permite una recuperación sencilla y rápida, pero utiliza la mitad de la capacidad para la redundancia. La paridad almacena redundancia calculada que puede reconstruir datos perdidos utilizando menos espacio, pero la reconstrucción es más lenta y computacionalmente más compleja.

Methods for this concept

Related concepts