RAID et fiabilité du stockage
Le RAID — acronyme de « redundant arrays of inexpensive disks » (grappes redondantes de disques peu coûteux) — combine plusieurs dispositifs de stockage en utilisant le découpage en bandes (striping), la mise en miroir (mirroring) et la parité pour offrir des performances, une capacité et une tolérance aux pannes supérieures à celles d'un seul dispositif, et constitue le fondement du stockage fiable dans les centres de données.
Definition
Le RAID est une architecture de stockage qui combine plusieurs disques physiques en une seule unité logique en utilisant des techniques telles que le découpage en bandes de données (data striping), la mise en miroir (mirroring) et la parité pour améliorer les performances et tolérer la défaillance d'un ou plusieurs disques sans perte de données.
Scope
Ce sujet aborde la fiabilité du stockage par la redondance : les niveaux RAID standard et leurs compromis entre performance, capacité et tolérance aux pannes ; le découpage en bandes, la mise en miroir et la parité ; les métriques de fiabilité telles que le temps moyen entre pannes (mean time to failure) et les limites de la redondance ; et comment le RAID complète mais ne remplace pas les sauvegardes. Il exclut les dispositifs de stockage eux-mêmes (dispositifs de stockage secondaire) et la couche du système de fichiers (systèmes de fichiers).
Core questions
- Comment le découpage en bandes, la mise en miroir et la parité assurent-ils la performance et la tolérance aux pannes ?
- Comment les niveaux RAID courants concilient-ils capacité, performance et fiabilité ?
- Comment la fiabilité d'une grappe est-elle quantifiée, et quelles sont les limites de la redondance ?
- Pourquoi le RAID ne remplace-t-il pas les sauvegardes ?
Key concepts
- découpage en bandes de données
- mise en miroir (RAID 1)
- parité (RAID 5/6)
- niveaux RAID et compromis
- tolérance aux pannes
- temps moyen entre pannes (MTTF)
- reconstruction et mode dégradé
- la redondance n'est pas une sauvegarde
Key theories
- Redondance pour un stockage fiable
- La combinaison de nombreux disques de base avec des informations redondantes (mise en miroir ou parité) produit une grappe plus rapide et beaucoup plus fiable qu'un seul disque ; les niveaux RAID formalisent la manière dont le découpage en bandes et la redondance sont organisés pour équilibrer les performances, la capacité utilisable et la tolérance aux défaillances.
Mechanisms
Le découpage en bandes (striping) répartit les données sur plusieurs disques pour paralléliser l'accès et augmenter le débit. La mise en miroir (mirroring) maintient des copies complètes sur plusieurs disques afin que la grappe survive à la perte d'un disque. Les schémas de parité stockent une redondance calculée qui permet de reconstruire les données en cas de défaillance d'un disque, en utilisant moins de capacité que la mise en miroir. Les niveaux RAID standard combinent ces techniques différemment ; lorsqu'un disque tombe en panne, la grappe fonctionne en mode dégradé et se reconstruit sur un disque de remplacement en utilisant les données et la redondance survivantes.
Clinical relevance
Le RAID est omniprésent dans les serveurs, les systèmes de stockage et les centres de données, où les défaillances de disques sont courantes à grande échelle et où une disponibilité continue est requise. Le choix du niveau RAID approprié permet d'équilibrer le coût, la vitesse et la résilience, mais le RAID ne protège que contre les défaillances de dispositifs ; il complète donc plutôt qu'il ne remplace les sauvegardes contre la suppression, la corruption et les catastrophes.
History
Le concept de RAID a été introduit dans un article de 1988 par Patterson, Gibson et Katz à Berkeley, qui proposait d'utiliser des grappes de disques peu coûteux avec redondance pour égaler la fiabilité et les performances des disques de grande capacité coûteux. La taxonomie des niveaux RAID a été largement adoptée, devenant une pratique standard dans le stockage d'entreprise et de centres de données.
Debates
- RAID parité versus mise en miroir à grande échelle
- À mesure que les capacités des disques augmentaient, les longs temps de reconstruction du RAID parité ont accru le risque d'une seconde défaillance pendant la reconstruction, suscitant un débat sur une redondance plus élevée (telle que la double parité) par rapport à la mise en miroir ou à des schémas de codage d'effacement alternatifs pour les grandes grappes.
Key figures
- David A. Patterson
- Garth Gibson
- Randy H. Katz
- John L. Hennessy
Related topics
Seminal works
- patterson1988raid
- hennessy2019
Frequently asked questions
- Le RAID remplace-t-il le besoin de sauvegardes ?
- Non. Le RAID protège contre la défaillance d'un disque en stockant des données redondantes, mais il ne protège pas contre la suppression accidentelle, la corruption de fichiers, les logiciels malveillants, les défaillances simultanées de plusieurs disques ou les catastrophes de site. Des sauvegardes indépendantes restent essentielles ; le RAID améliore la disponibilité, mais pas la protection générale contre la perte de données.
- Quelle est la différence entre la mise en miroir et la parité ?
- La mise en miroir maintient des copies complètes et dupliquées des données sur des disques séparés, offrant une récupération simple et rapide mais utilisant la moitié de la capacité pour la redondance. La parité stocke une redondance calculée qui peut reconstruire les données perdues en utilisant moins d'espace, mais la reconstruction est plus lente et plus complexe en termes de calcul.