RAID y fiabilidad del almacenamiento
RAID —matrices redundantes de discos económicos— combina múltiples dispositivos de almacenamiento utilizando seccionamiento (striping), duplicación (mirroring) y paridad para ofrecer mayor rendimiento, capacidad y tolerancia a fallos que cualquier dispositivo individual, y es la base del almacenamiento fiable en los centros de datos.
Definition
RAID es una arquitectura de almacenamiento que combina múltiples unidades físicas en una única unidad lógica utilizando técnicas como el seccionamiento de datos, la duplicación y la paridad para mejorar el rendimiento y tolerar el fallo de una o más unidades sin pérdida de datos.
Scope
Este tema abarca la fiabilidad del almacenamiento mediante la redundancia: los niveles RAID estándar y sus compensaciones entre rendimiento, capacidad y tolerancia a fallos; el seccionamiento, la duplicación y la paridad; las métricas de fiabilidad como el tiempo medio entre fallos y los límites de la redundancia; y cómo RAID complementa, pero no reemplaza, las copias de seguridad. Excluye los propios dispositivos de almacenamiento (dispositivos de almacenamiento secundario) y la capa del sistema de archivos (sistemas de archivos).
Core questions
- ¿Cómo el seccionamiento, la duplicación y la paridad proporcionan rendimiento y tolerancia a fallos?
- ¿Cómo los niveles RAID comunes compensan la capacidad, el rendimiento y la fiabilidad?
- ¿Cómo se cuantifica la fiabilidad de la matriz y cuáles son los límites de la redundancia?
- ¿Por qué RAID no es un sustituto de las copias de seguridad?
Key concepts
- seccionamiento de datos
- duplicación (RAID 1)
- paridad (RAID 5/6)
- niveles RAID y compensaciones
- tolerancia a fallos
- tiempo medio entre fallos (MTTF)
- reconstrucción y modo degradado
- la redundancia no es una copia de seguridad
Key theories
- Redundancia para un almacenamiento fiable
- La combinación de muchos discos comerciales con información redundante (duplicación o paridad) produce una matriz que es más rápida y mucho más fiable que un solo disco; los niveles RAID formalizan cómo se organizan el seccionamiento y la redundancia para equilibrar el rendimiento, la capacidad utilizable y la tolerancia a los fallos.
Mechanisms
El seccionamiento distribuye los datos entre las unidades para paralelizar el acceso y aumentar el rendimiento. La duplicación mantiene copias completas en múltiples unidades para que la matriz sobreviva a la pérdida de una unidad. Los esquemas de paridad almacenan redundancia calculada que permite reconstruir los datos cuando falla una unidad, utilizando menos capacidad que la duplicación. Los niveles RAID estándar combinan estas técnicas de forma diferente; cuando falla una unidad, la matriz funciona en modo degradado y se reconstruye en un reemplazo utilizando los datos y la redundancia supervivientes.
Clinical relevance
RAID es omnipresente en servidores, sistemas de almacenamiento y centros de datos, donde los fallos de las unidades son rutinarios a gran escala y se requiere disponibilidad continua. Elegir el nivel RAID adecuado equilibra el costo, la velocidad y la resiliencia, pero RAID solo protege contra fallos de dispositivos, por lo que complementa, en lugar de reemplazar, las copias de seguridad contra la eliminación, la corrupción y los desastres.
History
El concepto RAID fue introducido en un artículo de 1988 por Patterson, Gibson y Katz en Berkeley, que proponía el uso de matrices de discos económicos con redundancia para igualar la fiabilidad y el rendimiento de las costosas unidades grandes. La taxonomía de los niveles RAID fue ampliamente adoptada, convirtiéndose en una práctica estándar en el almacenamiento empresarial y de centros de datos.
Debates
- RAID de paridad versus duplicación a escala
- A medida que crecía la capacidad de las unidades, los largos tiempos de reconstrucción del RAID de paridad aumentaron el riesgo de un segundo fallo durante la reconstrucción, lo que provocó un debate sobre una mayor redundancia (como la doble paridad) frente a la duplicación o esquemas alternativos de codificación de borrado para grandes matrices.
Key figures
- David A. Patterson
- Garth Gibson
- Randy H. Katz
- John L. Hennessy
Related topics
Seminal works
- patterson1988raid
- hennessy2019
Frequently asked questions
- ¿RAID reemplaza la necesidad de copias de seguridad?
- No. RAID protege contra fallos de unidades almacenando datos redundantes, pero no protege contra la eliminación accidental, la corrupción de archivos, el malware, los fallos simultáneos de múltiples unidades o los desastres del sitio. Las copias de seguridad independientes siguen siendo esenciales; RAID mejora la disponibilidad, no la protección contra la pérdida de datos en general.
- ¿Cuál es la diferencia entre duplicación y paridad?
- La duplicación mantiene copias duplicadas completas de los datos en unidades separadas, lo que permite una recuperación sencilla y rápida, pero utiliza la mitad de la capacidad para la redundancia. La paridad almacena redundancia calculada que puede reconstruir datos perdidos utilizando menos espacio, pero la reconstrucción es más lenta y computacionalmente más compleja.